Page 1 of 1

识别所有有效和跟踪链接后

Posted: Sat Mar 01, 2025 6:53 am
by rakibhasanbd47
识别真实的 URL
您应尝试识别链接的真实(规范)URL。请注意,此步骤仅在您想要尝试删除有害链接时才必不可少。否则,如果您只想拒绝链接,则可以跳过此步骤,确保您拒绝每个有害链接网站的整个域,而不是链接到您网站的特定页面。

通常,网页上出现的链接可以被 阿根廷电话数据 爬虫发现并报告多次,因为在大多数情况下,它会出现在许多不同的 URL 下。这些 URL 可能包括博客的主页、类别页面、分页页面、提要、URL 中带有参数的页面以及其他典型的重复页面。

识别最初放置链接的页面的真实 URL(并删除所有其他重复页面的 URL)非常重要,因为:

它将有助于提出合理的链接删除请求,从而提高成功率。例如,联系网站管理员并请求从 feed、存档或分页页面中删除链接是毫无意义的。
它将有助于监控进度,并为您所做的所有努力收集证据。如果您以后需要向 Google 请求审核,后者将非常重要。
示例 1 – 新闻稿

在这个例子中,第一个 URL 是“真实”的,其他所有 URL 都需要删除。删除规范 URL 中包含的链接也会删除所有其他 URL 中的链接。

示例 2 – 目录 URL

在下面的例子中,无法立即看出实际链接位于哪个页面:


不幸的是,这一步可能非常耗时,而且我还没有遇到能够自动检测真实 URL 并立即删除冗余 URL 的自动化服务。如果您知道任何准确可靠的 URL,请随时在评论中分享这些示例 )