是什么促使您开始在新闻内容推荐领域工作?
我于 2005 年在美国开始了能源行业的职业生涯。我在能源行业工作了 12 年。能源行业是数据密集型行业,在我职业生涯的早期,我就接触过大数据项目。我确实很喜欢它,事后看来,这也是一种祝福,因为大数据分析在过去 5 年里确实取得了腾飞。云计算能力如此强大,大数据分析空间变得非常有趣。
那是我的职业生涯。就个人而言,我喜欢保持更新并跟上发展。我从各种来源获取新闻,包括新闻网站、社交媒体,当然还有专业博客。 2017年左右,我觉得将我对大数据分析和新闻的兴趣结合起来会很好,我从能源行业的大数据分析转向新闻内容推荐的大数据分析。
这如何引导您创立新闻学?
正如我上面提到的,我是一个狂热的新闻消费者。然而,我觉得我从公众那里得到新闻推荐,而不是某个领域的专家和专业人士。例如,我从公众(也许是我的朋友)那里收到有关营养的文章,我觉得我宁愿阅读营养学家推荐的内容。假设是,其领域的专业人士更了解新闻文章的质量。
我们进行了多次反馈会议来检验我们的假设,我们认为有必要解决这个问题。因此,我们早在 2017 年就开始了新闻学。一路上我们从用户社区和记者那里获得了反馈,以确保我们向用户推荐优质内容。我们不断收到有关我们应用程序建议的文章推荐的反馈,并相应地调整我们的产品。
典型的一天是什么样的?
我绝对是一个夜猫子,所以我典型的“夜晚”从我用现有系统分析我们的关键 KPI 开始,然后是我们正在构建的下一个改进的完成状态 - 这可能是对我们的 AI 引擎的调整,或者是对我们的应用程序。我们与分布式团队合作。我们没有固定的会议时间表。每个人都使用 Skype,因此我们只是互相发消息,如有必要,还可以召开电话会议。
所以我晚上的时间都花在了更多的技术工作上。一整天,我倾向于做其他任务,如营销、公关和客户反馈相关的工作。
您的工作安排是什么样的? (您的应用程序、生产力工具等)
我的笔记本电脑连接了双屏设置。我尽量避免在手机上写长电子邮件,并将其保留在电脑上,这样我就可以给出明确的指示和答案。我们的任务记录在 Trello 上。关于如何在 Trello 上记录问题、何时将任务标记为完成等,我们有非常明确的指导方针。我们尝试保持一种文化,为下一个用户提供大量信息,以便以最少的会议有效地推进任务。我们绝对是O365店。我们的文档、KPI、工作流程、演示文稿等都存储在 O365 云上。除此之外,我们还使用 GitHub 和 AWS。
AI如何呈现原创内容?
有一些新闻聚合应用程序使用人工智能来显示原始内容。这些应用程序可以通过多种方式使用人工智能来呈现原始内容。我将解释两种更常用的方法,然后解释新闻学使用的一种方法。
第一个可以使用的技术是协同过滤。我们可以用一个简单的例子来解释协同过滤。假设斯蒂芬对营养和减肥感兴趣。莎拉还对营养和减肥感兴趣。但莎拉也对海鲜感兴趣。也许我们应该向斯蒂芬推荐海鲜文章?如果斯蒂芬对海鲜文章缺乏兴趣,该模型将识别出这一点并测试另一个主题。您可以在这里看到人工智能引擎正在独立寻找读者可能感兴趣的新主题。
我们来谈谈第二种技术:Doc2Vec。有时,记者或博主会提供有趣的观点。这被大量本质上谈论同一件事的文章淹没了。我们可以使用 Doc2Vec 等算法来查看记者是否在谈论同一事件。例如,假设占星家在同一天发现了有关我们银河系的两件有趣的事情。我们可能有 10 名记者报道第一个活动,但只有 1 名记者报道第二个活动。 Doc2Vec 可以识别出实际上 10 名记者正在讨论同一事件,并且他们的文章将被分组为仅一个“显示”。第二篇有机会展示给对占星学感兴趣的用户。在这种情况下,人工智能帮助用户看到原本可能被隐藏的进展。
Newsology 增加的一个变化是,它还考虑了用户的专业背景。让我们使用 Sarah 和 Stephan 的第一个例子。如果新闻学用户声称他们是营养师,我们现在会在向 Sarah 和 Stephan 推荐有关营养文章的文章时添加第三个维度。即:营养师正在阅读哪些文章?有了这些信息,我们现在可以向莎拉和斯蒂芬推荐什么?
当然,新闻聚合应用程序使用的人工智能模型不仅仅是两三个。还有更多的模型可以一起工作、一起测试、一起推荐。他们也在自我了解他们的建议是否有效。例如,用户是否响应推荐。这称为 A/B 测试。如果用户没有响应,我们该怎么办?
对博主和作家有什么好处?
用户想要消费原创的、清晰的内容。有成千上万的博主和作家正在撰写未获得足够曝光度的原创内容。新闻学正在帮助独立博主和作家的内容浮出水面。
您坚持哪些授权技巧?
授权是一个过程。第一步是使用授权象限(重要/不重要与紧急/不紧急)。你会惊讶地发现有多少任务在这个阶段失败了。如果委托,我发现最好花时间自己先写下愿景/需求/问题,以确保我完全理解问题和期望的最终结果。在彻底思考任务之后,我会问自己谁是分配任务的最佳人选。重要的是要列出成功的样子,并鼓励代表问问自己是否认为任务已成功完成。这可确保完成任务的个人进行自己的质量控制。
来自我们合作伙伴的内容
您对进入人工智能和机器学习领域的雄心勃勃的数字出版和媒体专业人士有什么建议?
我将提供两个建议。一项软技能,一项硬技能。
在软技能方面,花大量时间聘请合适的人来完成任务。但是一旦你雇用了这个人,就不要害怕让你的团队达到高标准。你会惊讶地发现有多少人以“足够好”的心态行事。这不是他们的错。他们正在寻求您关于您的期望的指导。
在硬技能方面:人工智能和机器学习技术可以帮助您公开内容。尝试在文章中使用标签和关键字。抓取引擎正在寻找这些关键字。另外,不要淡化你的文章。有些出版商会在他们的文章中添加各种关键字。因此,他们的文章可能是关于徒步旅行的,但他们添加了“国际政治、时间旅行等”等背景关键词。人工智能引擎可以识别出这一点,而且,如果有什么不同的话,那就是展示你的文章会很麻烦。