抄袭是数字出版行业中很少讨论的现实。在网上快速搜索一下,就会发现许多关于高等教育中剽窃行为对学术机构和更广泛的经济造成的隐性成本的学术讨论。
然而,对于数字出版商来说,抄袭通常是为了防止作家将其他出版商的材料冒充为自己的材料。事实上,市场上有几个程序可以检查个别文章是否抄袭。
这些程序未能达到目标的地方在于,它们未能向内容所有者提供 a) 确保其内容不被窃取的方法,以及 b) 解决所发现的任何知识产权违规行为的简化方法。
PlagiaShield 的创建就是为了解决这些问题。除了传统的文档扫描仪之外,该软件不仅可以帮助出版商找到任何被盗内容,还可以简化删除内容的过程。
它提供了很多东西,但它兑现了这些承诺吗?如果确实如此,它融入出版商工作流程的难易程度如何?让我们来看看吧。
什么是 PlagiaShield?
PlagiaShield 是一种基于浏览器的在线抄袭检查工具,可自动扫描互联网以查找被盗内容。
它旨在帮助品牌、代理机构和出版商根除抄袭行为,并帮助保护他们在搜索引擎结果页面 (SERP) 中的地位。
该软件的独特卖点 (USP) 是,在扫描域名后,它将继续监控互联网是否存在抄袭和重复内容的情况,并提供有关其发现的任何发现的电子邮件更新。
抄袭和重复内容之间的区别可能看起来不必要的学术性,但实际上它在这里非常重要。
PlagiaShield 提供了有关侵权行为的详细信息,使用户能够查看其整个网站或单个页面是否已被抓取。事实上,它甚至可以显示是否从特定文章中提取了单个句子,甚至提供了这些句子的百分比匹配。
很容易看出是否有少量句子被编辑——这里一个单词,那里一些标点符号——以帮助避免传统的抄袭检查。这意味着该工具距离语义抄袭检测的圣杯又近了一步。
这种详细程度提供了一些直接的优势。通过使用重复内容的百分比模型,用户可以立即看到最大的风险在哪里,为他们提供审查过程的起点。
它还可以帮助出版商了解网站是否主动抄袭其内容,或者只是未能提供正确的引用。这意味着发布商可以请求适当的反向链接,而不是提交删除请求。
重复内容的 SEO 风险
如上所述,PlagiaShield 的既定目标是帮助发布商避免失去 SERP 的可见性。
这是因为,当涉及重复内容时,搜索引擎可能很难知道要索引哪些内容以及要包含哪些内容。即使搜索引擎对每个版本都建立了索引,他们仍然会以提供最佳搜索体验的名义选择一个版本来响应搜索查询。 在内容联合过程中使用规范标签是有原因的。
只选择一个页面会削弱其他页面的 SERP 可见性——如果算法不选择原始页面,这将是一个主要问题。谷歌甚至还承认,其系统偏爱排名较高的页面,即使它识别了内容的原始创建者,它仍然可以选择排名较高的网站。
但谷歌也表示,它重视原创内容,该公司于 2022 年 8 月推出了核心 SERP 算法更新,称为“有用内容更新” ,谷歌将其描述为“确保人们看到更多原创、有用内容的更广泛努力的一部分”由人、为人、在搜索结果中。”
数字出版商不仅投资于高质量的原创内容,而且越来越多地投资于内容优化,而抄袭对这种投资构成了非常现实的威胁。这让我们回到 PlagiaShield,该公司对 2022 年领先新闻出版商的内容被盗进行了自己的研究,发现扫描的文章中有 62% 不再是唯一的。
PlagiaShield 定价和功能
PlagiaShield 提供免费版本,其中包括每月对单个域上最多 100 个网页进行单次扫描,以及每月 10 次最多 2,000 个单词的免费抄袭扫描。此层可用作现有发布商或新发布商的演示,以确保其内容不会被更高权威的网站复制。
然而,该公司的三个付费层提供了更多的功能。
Pro 级别起价为每月 29 美元,面向品牌和内容代理机构,每月提供跨 5 个域的最多 1,000 个页面的扫描。用户可以选择每月支付 20 美元额外添加 1,000 个页面。作为该软件包的一部分,用户还可以获得聊天支持和该公司的DMCA Filler Chrome 扩展,该扩展可以加快填写 DMCA 删除请求的过程,然后通过 Search Console 提交给 Google。
出版商级别是定价的下一个跳跃,起价为每月 499 美元。然而,该级别针对的是较大的新闻媒体,除了 Pro 版的优势外,每周还提供最多 50 个域和最多 25,000 个页面的扫描。每月可以额外购买 10,000 页,价格为 99 美元。此外,该级别还提供团队管理和API访问。
PlagiaShield 还提供企业计划,其中包含自定义功能、支持和数十亿选项。例如,这适合使用订阅模式的出版商,因为 PlagiaShield 可以直接与其网站集成并保护付费内容。
PlagiaShield 仪表板入门
PlagiaShield 仪表板是一种极简主义实践,仅包含三个主要部分:域、文档和您的帐户。
第一个涉及网站抄袭监控,第二个涉及分析单个文档是否存在抄袭,第三个涉及计费和计划设置以及团队管理。
让我们仔细看看每一个。
域名
发布商注册帐户后,他们会被邀请添加域。每个付费订阅都允许添加多个域。
但是,请务必记住,每个帐户都共享受监控网页的公共池。这意味着什么?那么,选择基础级 Pro 套餐的用户可以监控跨 5 个域共享的总共 1,000 个页面。
虽然用户可以限制添加的每个域上监视的页面数量,但他们可以设置的最低页面限制为 1,000。这实际上意味着,为了能够监控 Pro 计划提供的所有五个域,用户需要每月为这额外的 4,000 个页面额外支付 80 美元。
在谈论这个配额时值得注意的是,PlagiaShield 仅监控包含超过 500 个字符的页面。此外,该平台还为用户提供了排除网站中不值得监控的部分的选项,例如类别和作者页面。这两个功能都将有助于保留页面配额。
虽然由个人用户决定是否愿意每月支付 109 美元来监控 5 个域名,但我们认为价格并不是一个症结所在。相反,我们希望看到的是充分利用每个订阅层所需的内容具有更大的透明度。
域名选择过程完成后,发布商可以在右侧的“列表域名”选项卡下轻松查看他们的网站。
单击菜单右侧的域名图像可显示潜在版权侵权的详细概述。
用户可以从该页面开始确定他们的内容是否已在网络上的其他地方被复制。 PlagiaShield 提供微观和宏观审查过滤器(分别为审查页面和审查域),供用户识别潜在侵权行为。让我们先仔细看看微过滤器的工作原理。
评论页面
此选项允许用户深入查看 PlagiaShield 发现重复的特定页面。用户可以通过选择相似页面的数量或找到的常见内容的百分比来过滤结果。
第一个过滤器可用于快速识别软件是否标记了重复的开源样板副本,例如隐私声明或会员常见问题解答。不过,理想情况下,用户应该在注册过程中就已经过滤掉了这些内容。
如果用户错过了这一点,他们可以告诉 PlagiaShield 忽略该页面,但必须等到计划期结束后才能重置其页面配额。
第二个过滤器是事情开始变得有趣的地方。通过根据您的网页和涉嫌 IP 盗窃的网页之间共享的数据量进行过滤,您可以查看哪些网页已被抓取。
如下所示, SODP 的洛杉矶著名出版公司目录与另一个页面共享 92% 的内容。
单击相关页面会弹出一个对话框,其中包含更详细的侵权情况。如下所示,两个页面之间有 156 个句子匹配,远远超出了内容相似度。
违规页面已经删除了SODP 的内容,甚至在 URL 和页面标题中包含了 State of Digital Publishing。查看来源部分会显示抄袭内容的更详细分类,让用户一眼就能看出哪些句子是直接复制(以红色突出显示)、哪些句子相似(黄色)、哪些句子不匹配(灰色)。
我们没有兴趣在这里嘲笑另一个网站,这就是我们模糊其网址的原因。我们将讨论的是 PlagiaShield 的删除请求工具,它有助于解决此类问题。
然而,正是在这里,我们在软件的用户体验方面犯了一个小错误。奇怪的是,删除请求无法从“审核页面”部分启动,需要用户导航到“审核域”部分。
我们认为,无论问题出现在哪个过滤器中,都能够解决这些问题,这对用户来说会更加友好,但我们真的不清楚为什么情况并非如此。无论如何,让我们看看评论域。
审查域名
一旦到达这里,用户就可以开始使用他们需要的工具来开始解决侵权问题。
例如,点击域名可以让用户对内容是否重复、出现违规内容的页面、网站所有者的潜在联系信息以及电子邮件模板以及 DMCA 侵权指南进行分类过程。
PlagiaShield 建议先尝试联系违规网站,然后再选择通过 Google Search Console ( GSC ) 提交 DMCA 的更严肃途径。该公司声称,根据其经验,直接联系该网站的情况下,大约 70% 的情况下会达到预期的结果。
以下是 PlagiaShield 为其用户起草的电子邮件模板示例。
如果没有任何可用的联系方式(就像我们的情况一样),那么用户应该直接向 Google 提交 DMCA 删除请求。
,使用 Chrome 扩展程序来加快Google DMCA 表单当我们开始使用该工具时,事实证明这一步非常难以导航,因为 PlagiaShield 尚未更新其用户指南。
值得庆幸的是,这个问题在审核过程中得到了纠正,现在有了详细的用户指南,大大简化了流程。
用户只需下载一个 .json 格式的电子表格,然后将其上传到扩展程序,这将为他们完成繁重的工作。该扩展程序将填写 DMCA,然后慢慢提交,以避免引发 Google 怀疑机器人正在代表您处理该流程。
我们建议您在第一次处理此任务时,将完整指南放在扩展程序的常见问题解答部分中。
文件
PlagiaShield 还提供文档抄袭检测器,其工作原理与许多其他此类工具类似。
但是,它确实附带了一些过滤选项,允许用户将搜索限制为仅来自自己域的页面或限制为来自外部网站的页面。
我们在一位作家委托撰写的故事初稿上尝试了该工具,并收到了预期的结果:这是一篇完全原创的文章。
CNN 关于英国国家医疗服务体系 (NHS) 状况的报道的前五句话,该报道刚刚在 7 小时前发布。该工具在几秒钟内就找到了原始副本。
令我们惊讶的不是该工具正确识别侵权行为,而是我们收到的信息水平。该工具不仅识别出 CNN 的文案,还显示了其他 20 多个也发布过该报道的网站。
对于希望快速检查每天提交的大量报道的新闻出版商来说,这是一个有用的工具。
然而,它的 2,000 字数限制确实意味着任何发布较长专题、调查、分析和研究论文,甚至专栏文章的媒体都会发现将这些文章分开是一件令人烦恼的事情。
另一个奇怪的地方是,对该工具的访问与帐户的页面配额相关,因此那些达到页面监控限制的用户将不允许使用该工具。
我们不太清楚为什么 PlagiaShield 会这样设计这个工具,因为用户可以随时简单地设置一个免费帐户来规避这个问题。
帮助与支持
PlagiaShield 没有太多支持指南或使用该工具的最佳方法。每个域屏幕的右上角都有一个指导按钮,提供每个部分的简要概述。
该公司表示,它更喜欢通过基于行为的电子邮件来引导用户,并且根据用户做了或没有做什么,他们会发送电子邮件来帮助他们采取下一步行动。然而,在实践中,我们希望采取更具战略性和预先性的措施来帮助我们尽快提高生产力。
我们并不是说缺乏文档是一个严重的失误,特别是在支持团队证明对指导我们解决出现的任何问题非常有帮助之后。但如果目标是帮助出版商快速识别和解决抄袭问题,那么任何能够更快地帮助我们扩展初始学习曲线的方法都会受到欢迎。
也就是说,一旦我们掌握了几个小时的经验,我们就对如何利用该平台充满信心。
PlagiaShield 评论
尽管使用任何新软件时不可避免地会出现牙齿问题,但 PlagiaShield 开发的工具套件给我们留下了深刻的印象。在检查抄袭方面,它确实是一个完整的软件包,适用于商业和学术应用。
PlagiaShield 的魅力所在
- 多域监控
- 涉嫌抄袭的详细分析
- 保护付费内容
- DMCA 自动化
- 包含文档检查器
- 极简界面
- 激光聚焦抄袭
- 反应迅速的支持团队
哪里有改进的空间
- 页面监控配额更加清晰
- 处理删除请求时的用户体验更加流畅
- 更详细的生产力指南
我们认为 PlagiaShield 已经通过其工具套件解决了这个问题。当然,我们在使用该平台时遇到了一些问题,但随着我们花更多时间使用它并开始看到它的实际效果,我们对在线抄袭检查器的影响范围有了惊人的了解。
该公司感到自豪的是,它是在 SEO 社区的贡献下开发的,这是理所当然的。对于像这个这样全面解决内容盗窃这样严重问题的工具来说,这绝非易事。
虽然 PlagiaShield 仍有空间来消除用户旅程中的一些障碍,但这绝不应该减损团队已成功融入平台的内容。