十多年来,出版业的人工智能(AI)稳步发展,一些主要媒体采用自动化系统来制作内容。最初用于天气预报、体育赛事回顾和财务报告,后来扩展到涵盖更广泛的创造性任务。
到 2020 年代,焦点主要转移到能够处理和模拟人类语言的生成人工智能。这主要是由于先进的机器学习模型可以识别非结构化数据集中的模式。这些模型可以分析数百万张图像、书籍和文章,根据特定的输入参数生成原始且非常类似人类的书面内容。
2022 年 11 月 ChatGPT 的发布大大提高了公众对人工智能技术的兴趣,引发了媒体专业人士对机器人失业的担忧。用户友好的聊天机器人界面使更多人能够探索自然语言处理 (NLP) 功能,其内容的整体质量促使自然出版集团和PNAS 期刊修改其编辑政策。
ChatGPT以前所未有的速度获得了 1 亿用户,使其开发商 OpenAI 的收入跃升至超过 10 亿美元。这一突破性的成功刺激了对人工智能公司的风险投资, 2023 年上半年投资额达到 400 亿美元,并促使企业探索人工智能在多个行业的能力。
全球媒体和娱乐市场人工智能预计将从 2023 年的 161 亿美元增长到 2030 年的 856 亿美元。资料来源:研究与市场
鉴于可用于模型训练的计算量不断增加,高级 NLP 聊天机器人尚未充分发挥其潜力。然而,人工智能已经像互联网的出现一样对出版界产生了深远的影响。
WAN-IFRA 对新闻出版商的调查显示,到 2023 年 5 月,大约一半的新闻出版商正在积极使用 ChatGPT 或类似工具,其中 70% 的人希望它们能够帮助记者。资料来源: WAN-IFRA
新技术改变了出版业的格局,为作家带来了挑战和好处,也为内容提供商带来了新的机遇。数据驱动的方法要求企业接受这些变化,熟练掌握基于人工智能的工具对于记者和编辑确保自己的职位至关重要。
什么是生成式人工智能?
生成式人工智能 (AI) 是一种能够生成新内容的机器学习模型,包括文本、图像、音乐、动画或代码。自我监督的学习格式处理大量人类生成的内容,使它们能够模仿人类创作者。
长期以来,人工智能主要围绕数据解释而发展,包括训练机器学习算法来理解图片中的内容。然而,当研究人员从图像识别转向图像生成时,这项新技术引起了广泛的关注。 2021年1月, OpenAI发布了DALL-E——一种将用户的文字描述转换为插图的模型。
《经济学人》杂志的封面是在另一个艺术生成器 Midjourney 中制作的,该杂志于 2022 年推出后大受欢迎。来源: 《经济学人》
生成式 AI 应用程序通过大型语言模型(LLM) 处理输入。受人类大脑的启发,法学硕士将单词和单词的一部分视为多维地图上的节点。他们努力定义这些节点之间的距离,从而预测特定序列中最有可能出现的下一个单词。有了更多的数据,法学硕士可以编写更复杂的文案或创建与主题相关的视觉效果。
微软已确认其 Bing 聊天机器人在 OpenAI 的 GPT-4 LLM 上运行,ChatGPT 订阅者也可以使用。那些不想订阅的人仍然可以免费访问 GPT-3.5。这两种服务提供了不同的体验,而Google 的 Bard 采用不同的模型。
这些高级聊天机器人的功能远不止文本生成。它们改变了我们与搜索引擎的交互,使查询和结果更具对话性。搜索生成体验(SGE)在这一转型中迈出下一步,该体验可通过美国和英国的谷歌实验室提供。
上图显示了 SGE 如何组织结果页面以帮助用户从单次搜索中获得更多信息。来源:谷歌实验室
SGE 建议对某个主题进行概述,并通过资源链接来支持该主题以供进一步探索。它给出了特定出版物将回答哪些问题的想法。
这些快速摘要和汇编简化了用户的导航。内容创建者提出了一些问题,即是否应该允许搜索引擎使用他们的内容进行培训。
最终,搜索引擎和聊天机器人可以使用人类创建的信息来帮助用户,而无需将读者发送到其源页面。
如今人工智能应用在哪些地方?
人工智能 (AI) 算法广泛应用于整个出版行业,从塑造新闻传递到定制付费专区的订阅者旅程。
例如,路透社早在 2016 年就使用其 News Tracer 工具来自动发现和验证 Twitter 上的突发新闻。最初,人工智能是关于自动化流程,以帮助出版商专注于内容创作。
《纽约时报》早在 2015 年就尝试过人工智能驱动的界面,自动执行日常标记和注释工作。资料来源:纽约时报实验室
《纽约时报》还率先使用规范分析来管理其付费专区。动态计量器根据订阅者如何与内容互动来决定非注册用户可以免费阅读多少文章。
新的能力拓宽了人工智能的应用范围,包括内容创建和管理。
根据 JournalismAI 全球调查,90% 的新闻编辑室在内容制作的不同阶段都采用了人工智能。资料来源:新闻人工智能
趋势和主题检测
Google Trends等监控服务可帮助发布商识别特定地区或人口统计的趋势主题。此外,人工智能工具可以帮助集思广益,并将建议作为进一步讨论的起点。
2023 年 6 月,科学家们推出了 AngleKindling,这是一种 GPT-3 驱动的工具,可以帮助记者探索新闻稿。来源: Github (PDF下载)
转录和翻译
从历史上看,记录采访和讨论一直是记者工作中最不受欢迎的方面之一。 Otter 、 Sembly和Airgram等会议助手可以生成笔记和摘要,让内容创建者能够专注于更有价值的任务。
这些服务以有限的语言运行,但丹麦数字报纸ZetlandGood Tape平台,能够转录 90 多种语言的音频。
不同语言的自动翻译发展也参差不齐,但主要是允许人们以最小的错误信息或侮辱风险来传达信息。
2022 年,芬兰公共广播公司 Yle为乌克兰难民推出了一项服务,提供自动翻译的报告,这些报告也经过了母语人士的检查。在疫情期间,Yle 已经开始用索马里语、阿拉伯语、库尔德语和波斯语提供信息。
写作和编辑
大型语言模型 (LLM) 可以检查语法并提供简洁的内容摘要、创建通知、针对时事通讯或社交媒体平台进行定制,并将书面副本转换为播客或视频的脚本。
ChatGPT、Bing、 Claude和其他 LLM 支持的服务可以建议引人入胜的头条新闻列表。尽管仍然需要验证,但机器学习算法简化了内容制作过程并提高了速度。
AuthorityHacker 对 3,812 名数字营销人员的调查发现,85.1% 使用 AI 的人用它来撰写文章或博客。来源: AuthorityHacker
2023年7月,澳大利亚新闻集团透露,人工智能技术让四名员工每周制作3000篇当地新闻文章。这使得超本地化标头占所有订阅量的 55%。
不过,新闻集团后来澄清,自动化主要涉及模板化信息,例如燃油价格更新或每日法庭清单,并且所有文章均由人工团队检查。
创建视觉效果
Midjourney、DALL-E 或 Stable Diffusion 等神经网络使作者和编辑能够为其文章和帖子制作插图。在添加其他品牌叠加层之前,我们花了大约七分钟的时间来创建、选择和编辑本文的基本封面图像。
创建独特图像的费用是每月 8 美元的订阅费用,考虑到独特图像比库存照片更有可能在 Google 图像搜索中排名,
另一张使用 Midjourney 专门为本文创建的图像
内容分发
人工智能帮助出版商细分客户,并确定向特定读者群体提供相关内容的最佳渠道、格式和时间。各种网站根据访问者的人口统计特征和之前的行为定制其主页。
内容个性化包括自动文章翻译、动态电子邮件营销活动或针对不同社交媒体平台定制现有内容。
社交媒体专用工具(例如 WordStream 或 Emplifi)可提供智能调度、广告活动优化、高级跟踪和受众洞察。
人工智能在出版业的好处
人工智能 (AI) 为出版社、媒体机构和个体记者提供了通过更快的日常运营和更明智的决策来节省时间和金钱的机会。它还使出版商能够加强与读者的关系,吸引新的受众并提高其文案质量。
成本效益
人工智能可以简化重复性的手动任务并减少员工的工作量,从而显着降低出版商的运营成本。机器学习算法提供了可操作的见解来优化其内容和营销策略,而无需承担与市场研究相关的高成本。与可用于内容创建的工具一起,它允许较小的团队以更大的规模运作。
先进的受众定位、快速且廉价的图像生成以及语法等写作和编辑助手,为数字出版提供了前所未有的机会。更高的分发准确性使利基媒体无需大量广告投资即可与读者建立联系。随着出版商提高效率,他们可以报道更广泛的活动。
研究援助和事实核查
人工智能可以帮助记者浏览大量文本,识别相关故事以及事实、事件、实体和人之间隐藏的联系。
new/s/leak由汉堡大学语言技术部维护,是一个免费工具,旨在筛选维基解密发布的信息。用于调查新闻业的人工智能项目的另一个例子是伦敦大学的DMINR 。
人工智能通过将新发布的信息与可靠来源的数据集进行比较,或追踪自搜索引擎首次检测到以来的图像历史记录,帮助区分事实和虚假信息。
一张截图证实,洛杉矶索菲体育场的“机器人”是电影《造物主》的广告演员。资料来源:路透社、事实核查探索者
内容个性化
尽管存在隐私问题,但对个性化体验的需求仍在不断增长。一项调查显示,这种需求可能会影响一半以上的消费者成为回头客(PDF下载) ,同比增长7%。
人工智能驱动的工具允许媒体组织定制其内容以进行有针对性的分发。 2020 年,《华盛顿邮报》发布了人工智能驱动的音频选举更新,并根据其政治播客听众的位置进行个性化设置。
为媒体公司定制的高级聊天机器人的屏幕截图。资料来源: Techcrunch
生成式人工智能为出版商提供了与读者进行个人互动的机会,现在他们可以将现有模型集成到客户支持服务中。
2023 年 2 月, Instagram 联合创始人推出了 Artifact ,这是一款个性化新闻应用程序,可根据读者偏好推荐可靠且经过事实核查的文章。此外,Artifact 允许用户在阅读和听力之间进行选择,因为它应用了具有自然发音的文本到语音模型。
屏幕截图显示,Artifact 用户可以收听以 Snoop Dogg 或 Gwyneth Paltrow 的声音朗读的报告和故事。来源: Medium
人工智能在出版领域的成功案例
出版业中人工智能 (AI) 的用例不断增长,为提高效率创造了新的机会。让我们探讨一些现有的成功案例,以进一步了解这项技术如何塑造行业。
5 个人工智能驱动的媒体项目
1.BuzzFeed
BuzzFeed 于 2023 年 1 月宣布,正在尝试使用 ChatGPT 来自动化其测验创建过程。
该测试在产生更多用户参与度方面取得了成功。访问者花在人工智能生成的测验上的时间比人类编辑创建的测验多出 40%。
整个 BuzzFeed 页面专门用于人工智能生成的测验。资料来源: BuzzFeed
2 福布斯
这家财经新闻巨头推出了专有发布平台 Bertie。这个由人工智能驱动的内容管理系统 (CMS)为新闻编辑室记者和撰稿人提供了基于他们之前出版物的热门话题列表。
此外,它还提供了引人入胜的标题和相关图像,尽管它并没有尝试撰写整篇文章。该系统推出后,《福布斯》每月访问量增加了一倍
Bertie CMS 为头条新闻提供建议。资料来源:福布斯
3、彭博社
彭博社推出了 BloombergGPT ,这是一种基于 500 亿个参数的特定领域语言模型。
该表显示了 BloombergGPT 在金融任务上如何优于同等规模的现有开放模型。来源: arXiv
4. 英国医学杂志
英国医学杂志 (BMJ)为研究文章生成引人入胜的圣诞节主题标题的能力有趣的是,受访者认为人工智能生成的标题至少与人类作者制作的标题一样有趣。
BMJ 的测试建议识别自动生成的标题。资料来源:英国医学杂志
5.环球邮报
这家加拿大报纸将其内容管理和分析平台Sophi Inc. 出售给全球收益管理公司 Mather Economics。这款人工智能驱动的工具旨在运营《环球邮报》的付费墙,但在转型后扩展到其他领域。
人工智能解决方案实施面临的挑战
采用人工智能 (AI) 的组织通常面临财务和技术限制。例如,较小的媒体可能缺乏资金来聘请合格的工程师。
出版商还必须考虑人工智能应用不慎可能导致的法律和声誉风险
超过 40% 的媒体经理在人工智能集成项目期间面临技术挑战,包括需要更多资金。来源:新闻艾
技术问题
尽管采用新技术有很多优点,但克服初始学习曲线的挑战可能会让出版商望而却步。他们不仅需要获得编辑的支持,还需要将新的解决方案集成到现有系统中。他们还担心会变得依赖于他们不完全理解的东西。
内容质量
生成的副本可能达不到预期,从而引发出版商的严厉批评。此外,大型语言模型 (LLM) 往往会延续其训练数据集中的错误。
一个值得注意的问题是各种偏见的持续存在,这是人工智能的一个共同特征,研究一直强调这一点。
道德挑战
偏见带来了需要解决的道德问题。另一个挑战涉及人工智能带来的工作风险,尤其是白领职位。它的实施可能会引发员工的担忧,需要积极主动的内部沟通。
法律风险
鉴于人工智能需要处理大量用户数据以生成个性化内容,因此它引发了数据安全问题。此外,由于用户输入敏感信息进行自动文本分析,企业越来越担心数据泄露。
此外,人工智能制作的内容在版权保护方面仍处于灰色地带,案件仍在审理中。
出版商还没有准备好完全依赖人工智能生成的内容。资料来源: WAN-IFRA
其他风险包括过度自动化以及随后失去独特的语气和一般人性化的感觉。但这直接让我们意识到出版团队需要持续监督。
最后的想法
预计到 2026 年,90%的在线内容可能是综合生成的。如果这一预测被证明准确,人工智能 (AI) 将深刻影响整个出版和内容创作行业。
报纸编辑、TikTok 创作者、设计师、作家——创意领域的每个人都会以某种方式感受到这种规模化的影响。它将改变就业市场,凸显数据工程技能和技术知识对记者的重要性。
随着人工智能集成的进展,出版商必须采取透明和道德的策略,并组建专门的工作组。鉴于需要进行事实核查以防范声誉风险,出版业的商业抱负将与道德价值观更加紧密地结合在一起。
话虽如此,出版商如果想保持竞争力,仍然需要利用人工智能来维持权威、探索读者行为并覆盖更广泛的受众。