有许多不同类型的网站提供了大量的免费、免费增值和付费数据,可以帮助受众开发人员和记者进行报道和叙事工作,State of Digital Publishing 团队希望承认这些数据来自手动搜索以及我们现有观众的认可。
1. 卡格尔
Kaggle 是一个允许用户在编写和共享基于云的代码时发现机器学习的网站。该网站主要依靠其庞大社区的热情,举办数据集竞赛以获得现金奖励,因此它汇集了大量数据。无论您是在寻找纽约证券交易所的历史数据、美国糖果生产趋势的概述还是前沿代码,该网站都提供了大量信息。
2. 维基百科
长时间上网而不遇到维基百科文章是不可能的。维基百科的文章范围从完全来源和参考历史传记到近期和遥远未来的时间表,可以肯定地说,维基百科已经巩固了其作为免费网络百科全书的地位。维基百科作为主题总体概述的条目以及该网站提供的许多书籍和在线参考资料,在许多方面都是作家最好的朋友。
3. 普通爬行
从网站的名称可以推测,Common Crawl 在网络上搜索或“爬行”数据,然后将其存储并构建在用户可以访问的开放存储库中。对于该网站的功能的两个示例,虚拟专利标记和提供 RSS 源的网站综合列表提供了该应用程序强大功能的一小部分示例。如果您想要进行数据或站点比较,这是一个用于创建原始信息的易于使用的工具。
4. EDRM
EDRM 是电子发现参考模型的缩写,是一个为法律专业人士提供的网站,致力于实现电子发现的潜力以及有关信息管理方式的规则和期望。此外,EDRM 成员共同开发协作标准、软件和教育工具,旨在进一步实现社区目标。要收集有关技术如何能够并且已经改变法律实践的程序和行政方面的信息,这是您想要访问的网站。
5. 马胡特
Mahout 专注于一款同名软件,该软件试图找出构建环境的逻辑,该环境能够创建可扩展和快速创建的高性能机器学习应用程序。对于希望编译和操作自己的数据集或尝试机器学习应用程序的研究人员来说,这款软件特别有用。该网站将帮助人们熟练使用该软件。
狐猴项目是一个数据库,专注于支持检索信息和处理人类语言技术的研究。 2009 年 1 月至 2009 年 2 月收集的网页数量约为 10 亿个,涉及 10 种语言,提供的大量材料和支持使其成为研究人员的绝佳资源。在所有这些以及网站上可以找到的附加支持之间,任何对技术和人类语言感兴趣的人都可以在这个网站上找到很多东西。
古腾堡计划是一个包含公共领域小说、论文和其他作品的目录。该网站拥有 54,000 多本电子书,其中包括莎士比亚、马克·吐温和简·奥斯汀等知名作品,以及亨利·柏格森和塞缪尔·巴特勒等鲜为人知的作品。无论是为了读懂经典小说还是研究 19 世纪人们如何体验生活,古腾堡计划都是一个极好的资源。
该网站拥有完整的数据集,其中包含大约 100 万首流行歌曲的音频特征和元数据。除了主要的百万歌曲数据集之外,社区还贡献了一些相关类别的数据集,例如翻唱歌曲、流派标签和歌词等。想要这些信息的音乐历史学家、爱好者或研究人员将能够相对轻松地对数据进行排序。这很可能是整个互联网上有关该主题的最广泛的数据集。
9. 亚马逊
每个人都知道亚马逊是一家数字零售商,但您是否知道亚马逊还托管免费的公共数据集,任何人都可以访问这些数据集,而无需在自己的设备上存储或下载任何内容?数据涵盖从天气、空间环境、气象信息到专注于开发有助于计算机视觉的算法的图像,对于那些想要以更便捷的方式分析大量数据的人来说,不乏选择。
10. 加拿大开放政府
为了提高透明度、让更多公民参与并鼓励对话,加拿大政府提供了大量数据,作为其开放政府计划的一部分。在此网站上,您可以找到有关政府相关问题的数据集,例如加拿大无家可归者收容所的容量水平以及公共部门中英语和法语使用者参与水平的区域数据。通过访问这种性质的数据集,无需依赖其他人的统计数据来查找信息。
11. 数据目录
数据目录(现在的数据门户)为用户提供了一个方便的站点来浏览世界各地的开放数据门户。这些门户网站经过各级政府、许多非政府组织甚至世界银行的评估和管理,可用于分析的数据质量极高。用户可以选择浏览或贡献数据门户。从研究的角度来看,主题和信息的多样性使该网站成为开始搜索信息的特别方便的地方。
12。英国数据网
Data.gov.uk 是一个允许个人查找和访问各个公共机构、政府部门、地方当局和政府机构发布的数据的网站。在这里,研究人员可以找到有关小企业、贸易、进口、工业和出口的经济环境的信息,甚至可以对政府部门支付的超过 25,000 英镑的款项进行研究。由于该网站明确声明数据可用于研究,因此当研究人员浏览时,此处涵盖的信息甚至可能会产生更多想法。
13。数据网
该网站是美国政府提供公众可以以数据集形式访问的开放数据的地方。除了原始数据之外,该网站还提供了许多工具,可用于进行数据可视化以及构建网络和移动应用程序。别搞错了。数据量巨大,涵盖从信用卡投诉到联邦学生贷款计划数据等超过 197,000 个数据集中的信息。该网站提供了大量创新和综合分析的机会。
14。数据SF
DataSF 提供了数百个与旧金山市和县相关的数据集。有兴趣了解当地和地区游说者一直在推动什么吗?您需要犯罪统计数据吗?浏览“展示”选项卡以查看人们使用数据完成的工作或使用表单做出贡献。该网站采用开放数据制作,提供学院、博客和许多其他工具,很大程度上是由协作和社区驱动的。这使其成为研究人员的资产。
15. 数据费雷特
DataFerrett 与许多网站的不同之处在于,它不是一个存储库或目录,而是一个允许用户通过数据分析和提取来自定义来自本地、州和联邦来源的数据的工具。该工具允许用户创建定制的综合电子表格,然后将相同的信息转换为地图或图表,而无需下载或启用任何其他软件。组织大量数据输入并将其转化为易于阅读的内容从未如此简单。
16. 信息论坛
Inforum 通过马里兰大学向公众提供美国经济数据。许多美国政府机构都为该网站做出了贡献,该网站现在拥有数千个所谓的“经济时间序列”,其中包含工业生产、价格指数、劳动力统计和商业指标的数据。这些数据是免费提供的,可以通过个人笔记本电脑或台式机访问。想要深入了解原始经济数据的研究人员可以在 Inforum 中找到资源。
17. 欧洲
根据该网站自己的数据,Europeana 的馆藏总数超过 5000 万条记录。使用此处整理的数据集,研究人员可以在更短的时间内找到他们正在寻找的信息。这里的数据集包括 3D 模型、意大利第一次世界大战地图等类别,甚至还包括来自立陶宛博物馆等的 20,000 多张历史照片。无论是一般历史搜索还是作为浏览欧洲大量记录的起点,这都是一个极好的资源。
18。卫报
除了不间断地报道突发新闻和事件之外,《卫报》还有一整个版块专门介绍数据简介。这里的文章范围从严肃的话题(如住房政策对无家可归者的有效性)到稍微轻松一点的话题(如哪些国家拥有最多的诺贝尔奖获得者)。记者和研究人员从该网站获取的信息可用于他们自己的项目。借助快速搜索,几乎可以找到任何内容的数据。
19。基因表达综合
Gene Expression Omnibus 由国家生物技术信息中心主办,是一个包含符合 MIAME(关于微阵列实验的最低信息)标准的“公共功能基因组学数据”的网站。该网站还接受排列或排序的数据,同时提供查找和下载信息所需的工具。那些对研究基因组或获取有关该主题的信息感兴趣的人将在这里获得他们需要的所有数据,然后是一些数据。
20。芝加哥大学
芝加哥大学空间数据科学中心 (CSDS) 因其对社会科学领域创新和进步的贡献而长期受到认可,通过进军空间分析和技术来探索下一个前沿领域。 CSDS 的工作几乎适用于任何在解决问题时必须应对空间问题的领域。因此,环境经济学、公共卫生和犯罪学等领域都从这些应用中受益。 CSDS 对开源软件的奉献及其信息的分发使得提供的数据更加容易访问。
21。科内克特
通过使用科布伦茨兰道大学网络科学与技术研究所收集的数据,KONECT(科布伦茨网络集合)提供网络科学及其相关学科领域的研究成果。该项目使用一系列自己的软件网络分析工具来处理数字并生成绘图和算法。然后,KONECT 将其分析工作的结果直接托管在网站上。有超过 200 个数据集可供选择,这是一个值得探索的资源。
22。管理数据
MIdata 是一个充当机器学习数据使用的数据存储库的网站。这些数据集的范围从人类面部表情的汇编到更科学的主题,例如预测分子如何结合。通过将条目分为不同类别,提供对原始数据、材料和方法部分中的教程以及学习任务和挑战的访问,该网站允许研究人员通过存储库解析感兴趣的数据集。
23。纳斯达克
纳斯达克是世界著名的证券交易所,长期以来一直是记者和研究人员寻找金融和商业数据的绝佳资源。在这里,您可以找到有关 IPO 的信息、历史价格数据以及重大财经新闻,这些使该网站成为获取财经数据的首选在线目的地。纳斯达克综合指数还为那些希望进行更深入分析的人提供付费数据选项。这是一个非常受尊敬且完善的资源。
24。美国宇航局
追溯到登月以来,现在每个人都听说过这个政府机构及其对外太空的进军。然而,记者感兴趣的是,美国宇航局如何通过其空间科学数据协调档案库成为宝贵的数据源。在这里,研究人员能够找到天体物理学、图像资源和太阳物理学等类别的空间科学任务数据。此外,网站上还提供大量白皮书来配合提交的新数据。
25。苏格拉底
Socrata 是一个网站,它获取可用的政府数据并将其转换成一种格式,使人们更容易分析、点击并找到他们正在寻找的信息。 Socrata 专为满足公共政策专家、研究人员、企业家和相关公民等非技术人员的需求而设计,它使用云来编译来自各种来源的数据。对于试图了解不同政策有效性的记者来说,这是一个有用的平台。
26。康德尔
Quandle 是一个主要提供经济和金融数据的网站,这些数据的格式考虑到了投资专业人士的需求。该数据源依靠来自 CLS Group、联合国、中央银行和 Zacks 等可靠组织的 500 多个信息源来汇总数据,非常适合想要一目了然地了解全局的研究人员和记者。得益于该网站的 Excel 插件,用户直接访问数据也变得前所未有的简单。
27. 卡内基梅隆大学
卡内基梅隆大学作为优秀的学术机构享有当之无愧的声誉。许多人不知道的是,卡内基梅隆大学的 StatLab 对于记者搜索数据来说是一个有用的资源。该数据集存档包含有关 1986 年北美球员 MLB 工资等问题的数据,以及设计用于评估统计软件准确性的数据。为了换取认可,这些数据集可供公众使用。
28. 加州大学尔湾分校
加州大学欧文分校机器学习存储库(简称 UCI)是一个存储记者可以使用的大量有趣数据的网站。截至撰写本文时,该网站拥有 394 个数据集,此外还有一个额外的优势,即拥有易于搜索的界面。一些更受欢迎的数据集包括“使用智能手机进行人类活动识别”、葡萄酒和银行营销等主题的信息。作为使用所有这些数据的交换,该网站仅要求引用。
29. 加州大学河滨分校
如果您是一名正在研究机器学习发展的记者,那么 UCR 时间序列分类/聚类页面将是您的绝佳读物。该网站提供了一份有用的简报文件,将为您提供您需要了解的所有背景信息。除了信息包含内容的概述外,该网站还提供直接下载数据的功能。如果您使用这些数据集,请记住使用网站要求的引文格式。
30. 美国人口普查
需要人口财富统计数据吗?想知道某个特定领域的确切性别细分是什么?美国人口普查网站拥有所有这些数据以及更多可供公众查看的数据。按年份或地区对数据进行排序,您很快就能找到大多数人甚至不知道的统计数据,这些统计数据已被纳入美国人口普查中。这些数字可在 Excel 和 Microsoft Word 中作为选项使用,使记者更容易获取数据。
31. 沃尔夫勒姆·阿尔法
Wolfram Alpha 实际上是一个计算引擎,允许用户输入他们想要知道的数据并接收计算结果。该引擎可以进行统计数据和分析、化学、日期和时间,甚至单词和语言学等。对于试图发现处理数据的新方法的用户来说,这特别有用,因为它只需按一下按钮就可以输出新的计算结果。记者尤其可以通过将此作为补充资源获益匪浅。
32. 喊叫
事实证明,Yelp 不仅仅是餐馆和用户商业评论。这个用户驱动的评论网站还保留一个数据集,使研究人员能够出于“个人、教育和学术目的”访问评论、用户数据和企业。根据该公司的统计,数据集中包含 12 个大都市区的 470 万条评论和 156,000 家企业。有了这些数字,研究人员可能会在这些数据中发现的材料和趋势可能会令人惊喜。
33. 数据世界
想要获得已删除的 Facebook 页面的列表吗?能够按县对美国经济数据进行排序听起来怎么样?数据世界是一个允许人们共享、托管、协作和跟踪数据的网站。该网站甚至包括一个记者专区,概述了数据世界对专业人士有用的原因,同时还指出了简化的 FOIA 预测器的托管功能以及旨在帮助组织的页面。总而言之,这是数据和数据托管的坚实结合。
《世界概况》由中央情报局运营和运营,为您提供有关 267 个国家的社会结构、历史、军事和经济状况的信息,以及地图、国旗和遵循世界地图材料的一组时区。该网站以超越基础知识的方式对主题进行全面、深入的了解。简而言之,这是每个记者都应该拥有的数据源。
35. 健康数据网
HealthData.gov 由美国卫生与公众服务部管理,为公众提供“高价值健康数据”,希望引起企业家、政策制定者和研究人员的关注。至少在产品和服务开发领域,人们已经能够检查这些数据并获得结果。想要了解最前沿的健康数据或正在审查卫生保健官员发布的声明的记者可以使用该网站寻找答案。
36. 联合国儿童基金会
该网站可以为使用其提供信息的记者提供即时可信度。儿童基金会涵盖的统计数据包括与健康和人权问题有关的统计数据,例如教育、孕产妇保健、儿童贫困、水和卫生设施、儿童残疾以及保存的许多其他类别的统计数据。它对研究人员很有用,因为它是最新的,并且得到了地球上最著名的组织之一的支持。记者引用这个数据来源不会出错。
37. 世界卫生组织
世界卫生组织是一个收集世界各地健康统计数据和信息的国际组织。除了可以直接在主页上找到的信息外,该网站还通过全球健康观察站提供数据。这些数据包括各国为实现全民医疗保健、卫生研究和发展等类别所采取的步骤的信息。记者可以在这里从国际角度找到有关疫情、突发卫生事件和医疗保健覆盖的大量信息。
38. 谷歌公开数据
随着谷歌公共数据的出现,记者显然能够以多种方式依赖谷歌。这家搜索引擎巨头拥有可用的公共数据,可用于分析 100 多个公共数据集。数据主题范围从极其严肃的世界发展指标和人类发展指标一直到有趣的欧洲最危险道路的数据。研究人员所要做的就是进行搜索并查看谷歌公共数据有什么。
39. 差距管理者
Gap Minder 提供许多地方和国家指标的数据以及所有数据提供商的链接和信息。使用该网站,研究人员可以查看诸如女性第一次结婚的年龄、饮酒统计数据以及儿童死亡原因等信息。对于以国际视角写作或进行比较数据的记者来说,这是一个极好的资源。无论如何,这都是一个有用的数据源。
40. 谷歌趋势
谷歌趋势是一个工具,可以让研究人员深入了解人们此时此刻正在寻找什么。研究人员可以将数据与过去发生的趋势进行比较,还可以使用该工具在假日季节等之前进行估计,以了解未来的搜索情况。 Google 趋势提供图表、热门话题以及大量在正式新闻发布之前发现新闻的机会。
41. 谷歌财经
Google 财经提供了一个快速、轻松的机会,可以对投资者一直热衷的公司进行更深入的搜索。在一个简单、直接的窗口中过滤技术指标和查看有关公司的最新新闻的简单方法,使您可以对信息进行更多分类。此外,它是免费的。对于想要研究上市公司财务状况的记者来说,Google 财经提供了一个直观的界面来访问这些信息。不幸的是,谷歌最近停止了一些核心功能,例如金融组合。以下是Google 财经的一些替代方案。
42. 数据库百科
任何曾经希望以更简单的方式运行 Wikipedia 搜索的人都有理由对 DBpedia 感到兴奋。在社区承诺的支持下,该网站力求对维基百科内容进行更复杂的搜索。英文版拥有 458 万个带有分类和相关类别的条目,该网站正在根据维基百科的信息提供全面的覆盖范围。记者使用这个数据源不会出错。
43. 皮尤研究中心
对于许多人来说,皮尤研究中心在调查、报告和研究数据方面处于较高水平。该网站涵盖的主题范围从政治观点到社会趋势以及各个工作行业的发展。皮尤研究中心还具有搜索功能,可以比以往更轻松地访问信息。想要获得来自可信且有信誉的来源的最新统计数据和调查结果的记者向皮尤研究中心求助是不会出错的。
44. 布罗德研究所
对于想要了解与癌症相关的最新新闻的记者来说,布罗德研究所的数据集可能是查找信息的最佳场所。这还包括有关其他主题的信息,例如生物信息学和计算生物学以及脑癌和分子模式发现。简而言之,该网站为记者提供了寻找有关癌症的深入数据以利用布罗德研究所提供的数据进行报道的优势。
45. 联合国数据
UNdata 提供世界各地不同国家的信息。这包括每个涉及国家的技术指标、社会指标和经济指标等数据。对于那些从事人文报道或可以通过一些额外的统计数据和数据证实的报道的记者来说,UNdata 是理想的选择。数据的准确性以及联合国的声誉使其成为记者在进行研究时可以信赖的数据源。
46. 谷歌学术
想象一下,如果不用滚动浏览网站,而是可以进行除了同行评审的论文和学术材料之外什么都没有的搜索。 Google Scholar 使人们能够查找世界领先学者的期刊文章、白皮书和出版物。正如该公司通常的情况一样,谷歌学术搜索非常直观,用户只需输入关键字即可开始工作。搜索学术论文从未如此简单。
47. 红迪网
Reddit 被称为“互联网首页”,是互联网上最受欢迎的网站之一。除了准确衡量网上发生的事情之外,该网站还有一个 Reddit 子版块或子论坛,专门用于数据集。用户可以请求数据集、发布资源并讨论如何通过 JSON 等格式处理数据。研究人员通过仔细研究这个数据源可以获得很多收获。
48. 数据市场
Qlik DataMarket 使您能够收集和处理来自外部源的数据。该平台允许用户跨多个数据集借用,并可以选择将其与他们已经拥有的数据进行交叉引用,以完善他们对更大背景的感知。更好的是,尽管这是一个付费平台,具体取决于主题,但 Qlik Datamarket 也有免费选项。记者可以随心所欲地探索数据。
49. 集线器点
Hubspot 一直是企业营销名人录中的思想领袖。从研究的角度来看,这个网站将告诉研究人员有关该行业正在发生的一切以及营销行业内的人们现在正在实时谈论的内容。记者可以使用该网站了解有关趋势的更多信息。从这一点来看,Hubspot 对于研究人员来说是一个很好的资源。
50. 司法统计局
也许并不奇怪,司法局保留了大量统计数据。在该局的网站上,您可以找到有关逮捕、囚犯死亡、死刑执行、执法统计数据和监狱人口普查的数据。刑事司法系统一直是公众和相关人员所关注的话题。这使得司法局的统计数据对于研究刑事司法系统的记者来说更加有用。
51. 统一犯罪报告
统一犯罪报告是联邦调查局收集的财产犯罪和暴力犯罪统计数据的集合。虽然美国各地的执法机构自 1930 年以来一直在报告这些数据,但发布的调查结果可追溯到 1958 年,可以搜索 .希望探索犯罪数据的记者可以选择访问并使用 UCR 数据工具来探索该网站上提供的信息。
52. 统一犯罪报告
统一犯罪报告是国际警察局长协会于 1929 年提出的一项计划的结果。联邦调查局收集的数据每年发布四次。除了 UCR 项目提供的信息之外,该网站还包括仇恨犯罪统计数据、执法人员被杀和袭击 (LEOKA) 的报告,以及国家事件报告系统提供的结果和数字。
53. NACJD
NACJD(即国家刑事司法数据档案馆)是一个从统一犯罪报告 (UCR) 和国家犯罪受害调查 (NCVS) 等数据集中提取信息,然后存储和分发统计数据的网站。这些数据经过精心设计、存储和维护,以实现最终的可访问性,数据有多种形式,包括实验数据、定性数据和纵向数据。最终,这为记者和其他研究人员提供了另一种可视化和访问刑事司法统计数据的方法。
54. 第一数据库
First Databank 是一个处理药物数据的网站。该网站致力于促进制药领域更高效、更数据驱动的决策。这使得医生和临床医生能够通过使用 First Databank 的创新技术开始以不同的方式思考药物。从专业的角度来看,该网站特别有用,因为它的数据可以帮助团队在新信息出现时进行调整。至少,这对于在制药领域写作的记者来说是一个有用的资源。
55. 食品和药物管理局
FDA,即食品和药物管理局,是负责通过监督和批准药品、食品、补充剂、疫苗和化妆品以及其他消费品来保护公众健康的机构。作为一种资源,FDA 提供可供公众仔细阅读的数据集,同时还为擅长使用电子表格并分析来自数据集的信息的人员提供技术数据。这对于记者来说绝对是一个有用的资源。
56. 药物库
有没有想过国家在毒品泛滥之后到底付出了多少代价?有传言说人们吸毒的方式与以前不同吗? Drugbase 提供了一个数据库,其中包含有关美国药物趋势和使用情况的统计数据。有关于成瘾和精神疾病的共病或药后(非酒后)驾驶事实等主题的信息图表和出版物。该资源提供了足够的信息来发现趋势并与过去的数据进行比较。
57. 毒品和犯罪问题办公室
UNODC(联合国毒品和犯罪问题办公室)有一个网站,致力于推进其目标,帮助成员国采用更严格的研究、数据收集和法证标准。在此网站上,研究人员可以找到大量统计数据和出版物,涵盖数据收集、趋势分析和研究项目等主题。该资源充满了各种法医相关主题以及该主题的科学信息。
58. 毒品战争事实
毒品战争事实是一个对毒品战争以及该政策的后果进行广泛讨论的网站。这包括详细的统计数据和数字,例如治疗成本与依赖执法成本之间的比较、药物管制支出估计数字,以及与毒品战争相关的几乎每个主题的大量信息。对于许多人来说,这是网络上有关毒品战争的最全面的网站。
59. 国家教育统计中心
国家教育统计中心(通常简称为 NCES)是获取所有教育相关统计数据的地方。该网站提供有关学生贷款状况的统计数据、教育趋势的预测,以及可用于进行更深入分析的数据集和比较工具。记者可以利用这一资源来发现趋势、验证公开声明、审查国家教育统计中心的出版物,并在数据中发现新的故事。
60. 世界银行
世界银行拥有发展数据小组编制的金融部门和宏观经济领域的大量统计数据和数据。可以使用主题标签对数据进行排序。用户可以在多种指标之间进行选择,并按国家进行选择,以审查发展进度的不同衡量标准。因此,任何研究成员国金融和/或经济状况的人都可以从中受益。
61. 劳工统计局
劳工统计局是记者获取数字和统计数据的首选来源,因为它们与当前工作条件、劳动力市场发生的情况以及价格变化和影响美国经济的方式有关。该机构的统计工作可以追溯到 1884 年,因此不乏可供研究人员仔细研究的经济数据。该网站将信息存储在用户友好的界面中,并不断更新可用于搜索的数据。这是一个值得探索的数据源。
62. 数字
轰动一时的发布引起了媒体的广泛关注,但如果没有数字,很难判断一家公司实际上做得如何。输入“数字”。该网站提供电影和娱乐行业的研究和数据。研究人员可以通过 OpusData 基于 SQL 的搜索引擎功能探索收入估计、对即将发布的版本的预期以及其他投资数据。 The Numbers 是研究人员访问电影和电影的可靠统计数据的第一个地方。这就是它成为优秀资源的原因。
63. 永远的电影
Film Forever 是一个网站,研究人员可以访问该网站获取英国电影业的市场情报和数据。在这里,用户可以找到英国 15 部最佳影片的每周票房数据、观众研究、报告、案例研究以及该组织的旗舰统计年鉴。此外,该网站还有一个日历,可以让观众了解下一次统计数据的发布时间。 Film Forever 的利基市场使其成为特别有价值的数据源。
64. 国际食品工业联合会
IFPI 是一个以掌握全球唱片业脉搏而自豪的网站。用户将找到已发布的报告,其中包含对录制音乐、国家和全球销售数据的深入见解,以及音乐行业业务方面的报告,这些报告显示了公司如何投资音乐。这些报告使用户可以了解正在发生的情况。该网站将使研究人员能够实时了解音乐行业的最新动态。
65. 斯塔斯塔
Statista 是一个类似于 Google 的搜索引擎,只不过该网站返回数据和统计数据而不是网页。只需按一下按钮,用户就可以立即访问超过一百万个统计数据和事实。用户可以找到有关中国、食品行业、消费市场的信息图表、统计数据,并且还可以付费查看档案和行业报告。无论是寻找有关经济、社交媒体还是巨无霸的信息,这里都是您的最佳选择。
66. 美国环保局
EPA 是美国环境保护署的缩写,是负责通过执行国会制定和通过的法律来保护人民和环境的政府机构。在美国环保署的网站上,用户可以浏览大量数据集,主题范围从农业到有毒化学品的年度排放量和废物管理方法。对于想要获取原始环境数据的记者来说,该网站是一个绝佳的选择。
67. 疾病控制和预防中心
美国疾病控制与预防中心的这个网站将自己定位为“环境公共卫生数据的一站式商店”。在此站点上,研究人员将找到接受国家资助的数据系统的参考和列表,同时跟踪和存储与环境公共卫生问题相关的信息。该资源重点关注在国家层面运行的程序,并可通过直接下载功能进行访问,因此是一个值得信赖的资源,可在网络上获取最新、最准确的信息。
68. 国家环境卫生中心
国家环境卫生中心是由三个以前独立的机构合并后成立的,是获取高质量环境信息的地方。提供从海洋数据到数百万年前的冰记录的全面数据,如果问题涉及环境,该网站很可能会提供相关信息。该机构对同类最大档案之一的管理的准确性和卓越性的承诺,也使其成为少数拥有、更新和维护此类数据的在线网站之一。
69. 国家气象局
美国国家海洋和大气管理局的国家气象局将告诉研究人员他们需要了解的有关天气的一切信息。该网站提供数据搜索,包括警告和预报、气候、地理预报等类别的信息。此外,它还带有直观、易于遵循的地图,其中包含可以单击以获得不同结果的选项卡。无论是回顾当地发生的事情还是查找不同州某个城市的天气预报,该网站都可以快速发现信息。
70. 地下世界
Wunderground 是一种资源,致力于确保世界各地的每个人都能获得天气信息,同时也关注覆盖范围较少的地区。 Wunderground 明确表示,已采取措施确保在多个数字平台上提供出色的用户体验。这意味着该网站可以通过移动设备和 PC 访问,使其成为忙碌记者的理想资源。
71. 气象基地
Weatherbase 借助简单的搜索栏,提供有关全球 40,000 多个城市的当前状况、平均值、气候信息和旅行条件的信息。使用该网站链接到的配套网站,可以找到更多旅行信息,包括货币转换器、坐标和县信息以及其他有趣的事实。 Weatherbase 还可以用于纯粹根据天气情况寻找度假地点。快乐搜索!
72. 能源图集
能源地图集由国际能源署出版,使研究人员能够通过能源统计数据了解世界。该网站自成立之日起最初就被设计为补充数据源,拥有动画桑基流能量平衡以及几个数据库以及可在国际能源署统计页面上细读的出版物。研究人员会发现该网站及其配套网站在研究国家和城市使用能源的方式时非常有用。
73. 经济分析局
经济分析局(Bureau of Economic Analysis,简称 BEA)发布了广泛的有用信息,使研究人员能够掌握国家经济的脉搏。该网站上有美国经济账户的数据,包括消费者支出、国内生产总值和固定资产等有用数据。研究人员可以按地区或行业以及国际、国家和地区搜索选项的级别进行搜索。尝试交互式数据页面以了解有关该局的更多信息。
74. 国家经济研究局
美国国家经济研究局(NBER)的网站是一个从分析角度研究经济学的数据源。它包含有关广泛经济主题的数据,包括非洲治理指数、官方商业周期、实验巧合、领先和衰退指数以及宏观历史数据库等条目。 NBER 以自己的名义发布和编制了官方数据集,以及其他出版商编制的索引。
75. 美国证券交易委员会
美国证券交易委员会是一个在促进市场透明度、公平性和效率方面充当监督机构的机构。有趣的是,该网站有一个从 2009 年 1 月到 2017 年 10 月的财务报表数据集,每个季度都会更新。研究人员可以依靠该网站来了解与备案相关的最新新闻,以及它可以告诉您有关公司及其财务状况的信息。
76. 国际货币基金组织
国际货币基金组织(International Monetary Fund),又称国际货币基金组织,是国际经济金融领域的一个历史悠久的组织。在该网站上,研究人员可以找到有关这些主题的大量数据。用户可以按指标和国家搜索数据集,并在研究时浏览图表和地图。热门数据集包括贸易方向、初级商品价格、金融稳健指标、调查和国际金融统计数据以及其他有价值的信息。
77. 地图集——哈佛
Atlas 最初由哈佛大学构思,是一种在线工具,可让人们可视化公司的贸易状况并与之互动。然后,阿特拉斯将利用这些信息并提出该国可能生产的不同产品,以改善其经济。这是政策制定者、商人、投资者和希望更好地了解特定国家经济环境的公众人士使用的工具。贸易和国民经济问题从未如此容易解决。
78. 做生意
《营商环境报告》是对商业法规进行客观评估的结果。该网站考察了近 200 个经济体和众多城市,衡量经济指标等细节并对营商便利度进行排名。该网站允许用户检查国家之间各种类型的商业法规的影响,并托管报告以及广泛的定性数据。此外,该网站还可以进行不同时间的比较。
79. 商品贸易统计数据库
Comtrade 最初是英国商业、能源和工业战略部与国际贸易部合作的一个项目,是一个极好的资源。该网站借用了联合国商品贸易统计数据库(Comtrade Data)的数据,为用户提供了一个交互式图表,可用于搜索、比较和分析各国之间贸易和货物的确切数字。只需选择报告国家/地区,选择合作伙伴国家/地区,然后进行尽可能多的选择。
80. 全球金融数据
全球金融数据不仅是编译标准金融数据的来源,它还包含从 1200 年代至今的金融信息。这些信息来自多种来源,包括书籍、档案材料、学术期刊和新闻期刊。此外,该网站还有利用链式链接统计方法的数据集。从用户的角度来看,最终结果是一种凭借其专有数据而与互联网上其他资源不同的资源。
81. 可视化经济学
可视化经济学与其说是数据发现意义上的资源,不如说是一种专注于设计信息图形和交互式仪表板的服务。此外,可视化经济学还进行分析和设计,其明确目的是让经济数据更容易理解。通过这个网站,记者有合法的机会与拥有多年经验的专业人士合作,将经济数据转化为更容易为公众所接受的数据。
82. 欧盟开放数据门户
欧盟开放数据门户是在欧盟委员会做出决定后设立的一个项目。在此网站上,欧盟机构免费提供数据供公众查看和使用,不受版权限制。数据集包括 CORDIS 参考数据、透明度登记册,甚至包括欧盟已对其实施金融制裁的人员、实体和团体的完整列表。此外,数据还以多种数字格式提供。
83. 开放数据网络
开放数据网络是一个允许用户按地区和城市查找数据的站点。该网站拥有清晰直观的主页,研究人员能够按数据类别、城市甚至样本问题进行搜索。在每个页面上,浏览数据类别或示例问题后,还有指向更多数据集的便捷链接。仅数据的组织就使开放数据网络成为一个非常值得探索的站点。
84. 陆地矩阵
Landmatrix 是一个提供土地交易在线数据库的网站,旨在提高收购的透明度。从本质上讲,该工具可用于可视化并理解各种土地交易。数据总是在改进、变化和调整,以提高可用信息的准确性。迄今为止,Landmatrix 拥有超过 1,000 笔交易的信息。这是一个值得研究人员探索的来源。
85. 联合国开发计划署
联合国开发计划署拥有大量有关世界各地人类发展的有用数据供公众探索。许多数据集中的日期通常从 1990 年到 2015 年,这些索引包括完整的表格,例如人类发展指数趋势、性别不平等指数和生命历程性别差距。研究人员可以直接通过搜索栏搜索数据,如果想要浏览图表,也可以按国家/地区进行搜索。
86. 开放式经济发展中心
经合组织(即经济合作与发展组织)有一个网站,专注于通过经济稳定和增长帮助各国政府实施反贫困举措和繁荣。在这个网站上,研究人员将找到经过同行评审的材料、出版物以及支持制定标准的标准和论据。经合组织还主办了一本资料手册,提供了可靠的经济参考工具,并可在其页面上找到有关经济前景的大量调查和预测。
87. 美国卫生与公众服务部
美国卫生与公众服务部运营着一个网站,提供有关总统健身、运动和营养委员会的信息。在厨师和运动员等相关领域专家的协助下整理的事实和数据。此外,该网站还有大量统计数据。研究人员可以找到有关儿童身体活动的事实、成人的肌肉强化习惯、公众的饮食习惯以及肥胖等众多其他事实和统计数据。
88. 公共卫生人员信息获取合作伙伴
公共卫生人员信息获取合作伙伴是一个由公共卫生组织、美国政府机构和专门从事健康科学的图书馆共同发起的项目。本网站的主题页面包括赠款和资助、健康促进和健康教育以及文献和指南等主题。通过“公共卫生主题”部分,还提供有关生物恐怖主义、公共卫生基因组学和牙科公共卫生等主题的数据。
89. 联合健康基金会
在过去的三十年里,联合健康基金会一直在提供健康排名信息,作为衡量公共卫生的手段。该网站拥有大量报告和出版物,包括有关服役人员的健康报告、高级报告、妇女和儿童健康、年度报告,甚至还有有关该领域重要主题的简报。使用交互式地图按地区探索并了解更多信息。如果研究人员正在寻找更具体的内容,还有一个搜索栏可用于进一步导航。
90. 医疗保险
在美国,医疗保险是许多人获得健康保险和获得医疗的主要手段。除了实时提供的服务外,医疗保险还通过比较图表和规则提供有关各机构和医院的治疗标准和质量的数据。它是 Hospital Compare 网站使用的官方数据集,其中充满了可以下载到 Excel 中的数据,以便进一步轻松访问。
监测、流行病学和最终结果(也称为 SEER)有一个网站,作为癌症统计信息的来源特别有用。它包含统计摘要,允许对与癌症相关的数字进行研究,这些数字可以按癌症部位、民族、种族、年龄、性别甚至数据类型进行排序。该网站还托管出版物、数据集和软件,研究人员可以使用它们进行更深入的分析。
92. 国际特赦组织
国际特赦组织是一个长期以来倡导世界各地人权和正义的组织。作为其年度报告的一部分,它还恰好在不同时间点提供了大量有关世界各地人权状况的数据以及有关具体暴行和危害人类罪的信息。研究人员可以利用这些信息对不同年份进行比较,了解不同国家在人权领域的进步或倒退。
93. 人权数据分析小组
自25年前成立以来,人权数据分析小组一直将科学原理应用于世界不同国家的侵犯人权行为。该网站包含在《华盛顿邮报》等知名媒体上发表的出版物以及通过麦克米伦出版商按年份排序的正式出版物。除了多年来组织的出版物外,世界各地也开展了一些项目。如果您想从技术角度更深入地了解侵犯人权的情况,这是一个很好的搜索。
94. 国际关系与人权数据
该网站托管由众多知名组织、大学甚至政府机构编制的数据库。这些例子包括宣言项目、少数群体(面临风险)项目、比较福利国家区和武装冲突数据库。有些项目,例如 Polity IV 项目,可以追溯到 1800 年代。与此同时,斯德哥尔摩国际和平研究所 (SIPRI) 等项目衡量武器转让、国际军事支出和安全趋势。欣赏数据的最佳方法是前往现场进行探索。
95. 乌普萨拉冲突数据计划
乌普萨拉和平与冲突研究部(通常称为 UCDP)拥有一个名为 UCDP 冲突百科全书的大型数据库。该网站允许用户点击并浏览该部门已经分类的数据。研究人员可以通过网站点击并下载以进行进一步的操作和分析。这是一种可以依靠和引用的资源,以可访问的方式分发质量信息。
96. 美国劳工部
美国劳工部拥有大量有关失业和就业统计数据的经济数据。当然,这些数字包括数据库,其中包括大规模裁员统计数据、就业预测、职位空缺和工作场所流动率、国家就业统计数据,甚至国际劳动力比较统计数据。该网站提供最新且准确的信息,而劳工部则跟踪所有信息。这是一个有信誉的资源,得到政府支持用于研究目的。
97.小企业管理局
小企业管理局长期以来一直是企业家和其他有抱负的企业家的可靠资源。该网站包含大量就业统计数据以及允许研究人员进行市场研究和竞争分析的信息。研究人员可以在这里找到可用于发现更多数据的数字、统计数据和工具。对于从雇主和企业角度来看的小企业统计信息,这是记者可以随时求助的绝佳资源。
98. 众包
Crowdpac 是一个允许政治候选人筹款和组织的平台。该网站很大程度上借鉴了每次选举都有许多基本上无人反对的国会候选人的理念,允许参与其中的公民组织支持。该网站提供了讨论相关政治问题(例如不公正划分选区)的文章以及民权和国家安全等其他主题,为了解和了解基层政治舞台上正在发生的事情提供了绝佳的机会。
99. 盖洛普
该网站是著名的盖洛普民意调查的所在地。盖洛普专门从事分析,使组织决策者能够通过基于数据的解决问题的方法来解决问题。此外,盖洛普建议的设备通常可用于驱动解决方案。这是一个被公认为数据和高级分析黄金标准的来源。只需浏览该网站即可浏览从全球工作场所状况到美国生产力讨论等各种内容的报告。
100. 伯克利图书馆
伯克利图书馆在其网站上拥有政治学研究统计数据和数据的完整汇编。在此页面上,研究人员将找到大量链接,这些链接使研究人员能够访问许多数据集以及构建自己的数据集的能力。其中包括美国历史统计 (HSUS)、千禧年版、数据星球、ProQuest Statistical Insight 以及大学间政治和社会研究联盟。有几个小时的数据需要处理。
101. 兰德国家服务
对于那些不知道的人来说,兰德公司是一个专门研究公共政策挑战的组织。该公司拥有涵盖各级政府的客户和投资组合,是用于决策目的的高质量研究的来源。该公司的美国分公司在其网站上托管着一组数据库统计数据。在这里,研究人员可以找到有关 K-12 教育、健康、商业和经济以及解决与公共利益相关问题的其他类别的信息。
102. 罗珀民意研究中心
罗珀民意研究中心由康奈尔大学运营和运营,专门收集、分发和保存民意数据。作为罗珀中心可以发现的信息类型的一个例子,研究人员可以访问美国大选的数据以及包含超过 23,000 个数据集的存档的链接。无论记者是在寻找公众对政治还是对最近的健康恐慌的反应,这个网站几乎肯定会提供信息。
103. 交通运输政府
该网站由交通局提供支持和运营,拥有涵盖广泛的交通相关主题的数据。该网站上的资源包括有关能源、乘客安全、能源、系统性能、运输经济、基础设施和货运的报告。用户甚至可以按位置和地理位置对本网站提供的数据进行排序和访问。该网站允许研究人员找到他们可能期望了解的有关交通相关主题的所有信息。
104. 旅游贸易
Travel Trade 是一个网站,其中包含截至撰写本文时 1996 年至 2016 年美国公民出境的数据。该资源的既定目标是帮助公众流程中感兴趣的成员,并了解全球旅游业和国际旅游业多年来的运作方式。这是一条可供下载和在线查看的信息。研究人员可以轻松地利用这些数据来发现趋势并进行比较。
105. 斯基夫特
Skift 是一个专注于为旅游业提供情报和数据的网站。除其他数据来源外,该公司还主办研究、会议和信息通讯,供订阅者和研究人员选择。 Skift 研究了旅游行业中的个人想要了解的主题,例如人们越来越多地去哪里旅游、识别新市场以及研究人员可以选择探索的有关旅游技术的大量其他信息。
106. 地理数据库
对于那些只想了解有关城市或地点的事实的人们来说,Geobase.se 是一个完美的网站。使用主页上的搜索引擎,只需按几个简单的按键即可查找坐标、旅行信息、天气,甚至本地网络摄像头镜头。该网站还设有一个页面,提供有关世界排名的信息,可以按地区和国家缩小范围。简而言之,这是一个提供纯数据和统计数据的资源。
107. 美国旅游
美国旅游拥有一个由美国国务院运营和维护的网站。该网站声称的使命是保护出国的美国公民的生命。因此,该来源提供有关美国护照、美国签证、跨国收养、海外死亡和国际亲子绑架等主题的统计数据、信息和报告。这些信息可在规划旅行时使用,也可用于通过 1996 年至 2016 年的统计数据来确定长期趋势。
108. 英国数据服务
在经济和社会研究委员会的资助下,英国数据服务收集发布了广泛的数据。该网站提供的信息包括商业数据、跨国调查、英国政府赞助的调查,甚至英国人口普查数据等材料。基本上,该网站的设计考虑到了学生和研究人员的需求。此外,还有指南、资源和说明,提供帮助研究人员快速理解和使用该网站上的工具的指南和资源。
109. 澳大利亚数据网
Data.gov.au 由澳大利亚政府运营和发布,提供开放数据的轻松访问和搜索。该网站明确指出,政府数据可用于开发工具和应用程序,从而造福澳大利亚人。不仅可以访问开放数据集,还可以付费访问未发布的数据。对于想要进行更深入分析的研究人员,该网站还提供了数据工具包。
110. 叽叽喳喳
每个人都知道 Twitter 的快节奏对话、短信以及它在流行文化中作为突发新闻中心的地位。然而,很多人不知道的是,Twitter 还拥有开发人员工具,可以更轻松地过滤和发现信息。这些工具甚至允许研究人员查看趋势并按地理位置进行筛选。无论是阅读热门话题标签还是探索开发者工具,Twitter 都是记者们使用相当长一段时间的资源。
111. Instagram
Instagram 不只是为了喜欢可爱的猫咪照片和可爱的婴儿照片。或者至少,不必如此。该应用程序拥有一套令人惊讶的复杂开发工具,可以轻松理解和对受众进行研究。此外,主题标签和人们发布的照片所揭示的线索以及其中被标记的个人都可以成为信息宝库。 Instagram 是发现不同领域流行趋势的有效方法。
112. 四方
对于位置很重要的研究类型,四广场是一个有用的数据源,因为它拥有庞大的数据库和它所编译的所有信息。表面上看,它有一个城市指南,根据社区的实力为用户提供建议。 Four Square 还拥有开发人员工具,允许通过位置数据库访问其他信息。记者可以使用它来了解有关特定位置以及使用该应用程序的人员的更多信息。
113. 纽约时报
《纽约时报》被许多人视为受人尊敬的第四阶层成员,很少有记者没有听说过。然而,经常被忽视的是通过其 API 使用《纽约时报》作为数据源。研究人员可以按月查找 1851 年以来的文章、搜索文章,甚至查找书评。该 API 允许根据视图、共享和电子邮件进行搜索,甚至可以查找和访问评论。
114. 美联社
美联社作为及时、准确的新闻来源,在流行文化中占有永久的地位。由于其开发工具,它也是记者有用的数据来源。截至撰写本文时,研究人员可以在下载图片和视频时使用这些工具进行自己的编辑。内容的级别似乎取决于研究人员使用的计划类型,但美联社 API 仍然允许用户将研究过程提升到另一个级别。
115. 五点三十八分
记者可能已经熟悉内特·西尔弗和五点三十八分以及他的统计模型,因为他有时出乎意料但通常是正确的预测。五点三十八有一个 GitHub,用于托管该网站历史过程中使用的数据集和编码。这些数据集包含有趣的主题,例如不良司机、复仇者联盟的数据以及飞行礼仪调查。与此同时,还有一些文件涉及稍微严重的问题,例如航空安全和仇恨犯罪。
116. 互联网医学数据库
IMDb 被许多人认为是网络上有关电影和表演行业最全面的网站。如果有一部电影即将上映,人们想知道其中的演员或想了解电影观众的总体反应,那么他们很可能会在搜索过程中的某个时刻登陆该网站。 IMDb 还托管大量每天刷新的数据集,可用于商业和非商业用途。
117. 韩国农业研究中心
KAPSARC 是一个数据门户,总共托管 923 个包含能源数据特定信息的数据集。这些集合分为能源使用、能源供应和其他相关因素(如政策、人口统计、环境、贸易、水、广告经济信息)的几个一般主题。对于对能源及其在不同行业和部门的使用方式感兴趣的研究人员来说,KAPSARC 是网络上最全面的能源数据源之一。
118.资产宏观
Asset Marco 是一个提供历史金融数据和宏观经济指标的网站。该数据涵盖全球 75,000 多种股票、货币、商品和债券。此外,该网站还有超过120,000个宏观经济指标,用户可以用来探索不同国家的金融数据。除了所有这些金融市场数据外,该网站还讨论投资策略。该来源非常独特,因为可以找到的信息量巨大。
119. 美国政府 Web 服务和 XML 数据源
美国政府 Web 服务和 XML 数据源托管在名为 USGovXML.com 的网站上。在这里,用户可以浏览美国政府提供的不同XML数据源和Web服务。这种简单的保存行为使这些网络资源保持透明并可供公众访问。对于一般定期监控该索引的研究人员来说,如果 XML 数据突然发生变化,就有可能在数据中找到线索。
120. 无花果树
Figshare 是一个拥有 5,000 多条可供学术研究和引用的科学内容的网站。除了那里的信息之外,该网站还旨在为研究人员提供一个单一位置,用于编译、上传、存储和管理他们发现的研究成果。数学、健康科学、工程、化学、生物科学和社会科学均被列为特色类别。对于记者寻找更多学术资源的网站来说,该网站是一个很好的来源。
121. 关联数据
LinkedData 是一个致力于寻找新方法来连接以前未链接的互联网数据的网站。在这里,用户可以找到教程、指南和数据集来推动故事的发展。这些数据集都聚焦于参与链接数据社区的主题,除了链接数据购物清单之外,大多数数据集都被归类为带有或不带有补充 RDF 格式的可解除引用的 URI。要了解有关此社区的更多信息,必须访问此网站。
122. 网络矿工
对于想要收集通过该程序找到的所有通用数据的研究人员来说,Web Miner 是一个完美的地方。该网站托管示例数据库,例如美国餐馆、世界各地银行的 SWIFT 代码、美国加油站、美国旅游景点、Google Play 应用程序以及其他大量列表。如果不出意外的话,这个网站将使记者能够更轻松、更快速地在更短的时间内筛选和发现大量数据。
123. 数据中心
数据中心以其成为用户可以尽可能快速有效地查找和发布数据的地方而自豪。该站点本身托管许多数据集。房价指数(Case-Shiller)、黄金月度价格和大气二氧化碳当前趋势是最受欢迎的三个。除了数据之外,该网站还提供了许多教程,用户可以通过这些教程来了解有关浏览各种类型的可用数据的更多信息。
124. 谜公共
Enigma Public 在其网站上将自己称为网络上“最广泛的公共数据集合”。这些数据集属于 FOIA、Essentials、Newsworthy 和 Under the Radar 四大类之一。该网站上的一些数据包括白宫员工的工资和有效的联邦枪支许可证。注册免费帐户后,用户可以访问可供查看的任何一类数据。
125. 雅虎
大多数网络用户都熟悉雅虎这个名字,因为喜欢 Yahoo!新闻和雅虎!在公司的众多在线资产中进行融资。研究人员和记者感兴趣的是,雅虎还托管大量数据集,包括 Yahoo!带有艺术家、专辑和流派元信息的歌曲的音乐用户评级,v. 1.0 和 Yahoo!电影用户评级和描述性内容信息,v.1.0 仅举两例。寻找新统计数据的记者从这个来源不会出错。
126. 1000 个基因组
1000 Genomes 是 2008 年至 2015 年开展的同名项目的所在地。该项目的目的是找到至少 1% 的被研究人群中可能出现的所有遗传变异。除了因该项目而发表的出版物之外,还有大量数据集,其中包括变异细胞的单独数据库、原始序列文件和样本可用性。该数据可以浏览或下载。
127. 芝加哥期权交易所
CBOE 是一家主要专注于波动性期货的期货交易所。特别是,该网站提供了大量有关期货的材料,这些材料都体现在该网站的商标波动率指数上。该网站提供各种市场数据,包括历史数据、每日市场统计数据和 VX 期货每日结算价格。对于寻求优质市场数据的记者来说,CBOE 是一个能够以易于遵循和理解的格式提供信息的网站。
128. 圣路易斯联储
圣路易斯联邦储备银行即使不是该地区最重要的金融中心,也是其中之一。在该网站上,研究人员可以直接阅读工作论文、经济数据、出版物和信息服务。换句话说,关于圣路易斯联储当前和过去的政策思路以及评估圣路易斯联储有效性的能力的信息并不缺乏。对于商业、金融和经济记者来说,这是一流的信息资源。
129. 万达
OANDA 是一个流行的在线股票交易平台,主要进行差价合约和外汇交易。除了为吸引在线交易者而向交易者添加的众多功能之外,OANDA 还在网站上托管了大量历史汇率数据以及货币转换器的历史信息。除了所有这些数据外,该网站还提供投资策略信息以及新闻和市场分析。访问大部分数据甚至不需要帐户。
130. ABS
澳大利亚统计局(ABS)与美国统计局没有什么不同,提供客观数据、经济信息以及与国家相关的广泛主题的研究。研究人员可以直接在网站上查找有关商业指标、医疗保健、住房、金融、国际贸易、住房、心理健康以及价格指数和通货膨胀的统计数据。记者可以进行搜索来查找较早的调查和信息,也可以按地区对信息进行排序。
131. 伦敦数据库
伦敦数据库最初由大伦敦管理局构思和运营,是伦敦试图让公众更容易获取伦敦数据的尝试。最终目标是让人们能够访问这些信息,同时鼓励他们以任何他们想要的方式免费使用这些信息。在此网站上,用户可以按艺术与文化、犯罪与社区安全、教育和健康等主题搜索数据。对此类数据感兴趣的记者现在可以直接从当地政府获取。
132. 新西兰统计局
新西兰政府在该网站上提供了大量统计数据和数据,供研究人员进行深入和分析。可以使用顶部的搜索栏,通过位置和区域以及主题进行过滤来筛选此信息。一些主题包括经济指标、健康、收入和工作、工业部门、环境和商业。在其他新闻来源和强调各种调查结果和统计数据的发布之间,记者将通过该网站发现各种新西兰特定的统计数据。
133. 澳大利亚政府气象局
澳大利亚气象局网站最终由澳大利亚政府运营和运营,提供与澳大利亚各个城市和地区相关的天气信息。根据该网站,该机构的成立是为了通过警告和建议相结合来帮助澳大利亚人应对周围的气候。在这里,研究人员将能够找到季节展望、蓄水量、降雨量预报、气候变化和季节性水流预报。在这个网站上,您可以找到有关澳大利亚天气的准确且有信誉的报道。
134. 群镜
本网站由明尼苏达大学计算机科学与工程系 GroupLens 提供。该网站提供出版物以及用于研究目的的数据集。总共大约有六个数据集。在指定的集合中,有一些名为 Book-Crossing、MovieLens 和 HetRec 2011。简而言之,对于寻求更好地了解如何使用所提供数据的记者来说,这是一个有用的资源。
135. KD 掘金队
KD Nuggets 是一个主要致力于为人们提供数据科学、业务分析、机器学习和数据挖掘的网站。该网站上有一个页面,其中包含完整的数据集列表,人们可以使用这些数据集对数据挖掘和大数据进行更多探索,其中包含 Bioassay Data、Asset Marco、DataMarket、Casualty Workbench、Data Ferrett 和 Datamob 等数据集,这些数据集都链接到。对于喜欢将所有信息放在一页上的记者来说,这是一个极好的资源。
137. 微软
每个使用过个人电脑或笔记本电脑的人可能至少听说过微软。有趣的是,除了个人电脑、笔记本电脑和软件之外,微软还举办了大量的研究和出版物。这包括公司寻求创建识字机器以及基于云的数据科学等突破。还有有关 Microsoft 正在开发的工具(例如 Visual Studio Code Tools)以及它们所代表的人工智能发展的其他信息。
138. 数据挖掘
正如其包装上所说,R Datamining 是有关 R 和数据挖掘的资源。该网站提供了大量示例和文档,深入介绍了数据挖掘和使用 R 进行数据挖掘。此外,还提供了培训课程的链接,例如堪培拉大学提供的短期课程。这包括免费数据集和演示文稿的链接,以及涵盖飞机、航空公司和路线数据等主题的数据集,以及 GeoDa 等网站的链接。
139. 计算神经科学合作研究——数据共享
计算神经科学协作研究(也称为 CRCN)拥有许多可以通过其网站访问的数据集。数据集按大脑的各个部分进行分类,例如视觉皮层、海马体、运动皮层、鸟类、眼球运动和海兔等。这些文件夹还包括挑战、工具、模拟和方法。共享这些数据的能力使其成为更好的研究资源。
140. 蛋白质数据库档案
根据其网站,自 1971 年以来,蛋白质数据库档案一直是有关核酸、蛋白质 3D 结构和复杂组装的首要资源。其成立的明确使命是将这些信息保留在公共领域,研究人员可以在这里查看验证在线报告和数据字典。还有数据增长和使用统计数据可用于基于网络的排序和分析以及下载。最重要的是,该网站始终在添加新信息。
141. 公共化学项目
PubChem 作为一个官方项目,旨在让公众从生物学的角度了解小分子的功能。该网站由三个数据库链接,包括 PubChem Compound、PubChem Substance 和 PubChem BioAssay。此外,该网站还使得搜索不同蛋白质之间的相似性成为可能。对于将数据分析提升到新水平的研究人员,该网站还提供免费的编码和技巧。
142. 科迈医疗
对于任何寻找生物学、健康和医学信息的人来说,Coremine Medical 都是一个宝贵的资源。既然 PubGene 的生物医学文本挖掘功能已经发展到目前的形式,Coremine 也是最灵活的生物医学信息来源之一。该网站将以一种视觉上引人入胜、易于理解的格式显示概念和想法之间的链接,否则这些链接可能不会被注意到。它无疑是记者可以获得的最全面的生物医学数据源之一。
143. 杜蒂姆波
Tu Tiempo 是世界上每个国家的天气和气候数据的令人难以置信的来源。使用此资源,可以轻松找到世界上几乎每个城市和地区的年度、每月和每日平均值。此外,用户还可以在数据库中进行搜索,该数据库包含超过1.15亿条记录,其中包含任何人都可以搜索的历史数据。根据搜索的区域,有可能找到追溯到 1929 年的数据。
144. 复杂的网络资源
该网站提供了对首次在计算机实验中使用的大量数据的访问。数据集的完整列表,列出了数据类型,包括新闻图、生物图、引文图、协作图、工程图和语义图。该页面还链接到包含大量信息的来源列表,例如检查大约 300 万项美国专利的数据集。该页面还拥有令人印象深刻的复杂网络数据集汇编。
145. 斯科普斯
Scopus 是一种允许个人快速轻松地查找研究和学术引文的工具。该网站提供了一个极其广泛的研究数据库,涵盖了世界各地许多领域的研究,包括医学、技术、社会科学、艺术和人文学科等。使用 Scopus 捕捉可能被忽视的学术资源。毕竟,在许多领域,学术来源的质量几乎与其提供的信息一样重要。
146. 斯坦福大学
斯坦福大学作为著名学术机构的声誉并非凭空而来。其卓越表现体现在其与编程相关的课程中。该网站还托管许多数据集,其中包括社交网络信息等详细信息。有一些以 Facebook 社交圈、维基百科管理员请求、Twitter 社交圈和 Google+ 为中心的数据集。通信网络和亚马逊产品网络也有自己的数据集。
147. 米兰大学
米兰大学信息科学系运行并运营一个名为“网络算法实验室”的网页。该网站拥有大量可供探索的数据集。其中包括与社交网络相关的图表、Facebook 图表、DELIS 项目的快照以及杂项数据的简短列表。如果选择的话,可以在线查看和下载此处提供的信息,这使其成为网络上同类数据集中最容易访问的数据集之一。
148. UCI 网络数据存储库
UCI 网络数据存储库是一个致力于采用科学方法来研究网络的网站。在资源页面上,研究人员将找到由研究组织和团体以及个人选择的数据集目录的链接。它还拥有一组通常用于社交媒体分析的数据集。那些深入研究数据的人会很高兴地发现这些数据集也可供下载。
149. 蔡达
CAIDA(应用互联网数据分析中心)通常在不同组织和个人的协助下,从多个不同地点收集广泛的数据。该网站上托管有一些数据集,例如 AS 关系、DDOS 攻击、Telescope 及其相关数据以及其他数据。这些类别包括流量、拓扑、安全、蠕虫摘要和流量摘要统计。数据集可能需要请求访问,但许多(如果不是大多数)都是公开的。
150. 克劳达
Crawdad(达特茅斯归档无线数据社区资源)的独特之处在于它专注于向研究人员和其他可能对该主题感兴趣的人提供无线数据。该网站提供了许多工具以及对大量数据集的访问。列出的集合包括教育用途、误码表征、网络诊断、机会连接、位置感知计算等可供选择的集合。研究人员越深入地研究它,就会欣赏这个资源。
151. 美国能源信息署
美国能源信息管理局通常被称为 EIA,其职责是向公众提供年度电力公用事业数据。该数据中的信息涵盖化石燃料库存、燃料消耗、每月和每年的发电信息以及环境数据等。数据已存在并可用于分析 2001 年至 2017 年的数据。研究人员所要做的就是导航到该网站并下载信息。
152. 英国海洋学数据
英国海洋学数据由国家环境研究委员会资助,是互联网上最容易访问的海洋数据来源之一。拥有广泛的数据库,涉及海流、CTD 剖面、国际海平面数据、海流,甚至历史底部压力记录器数据。此外,在已发布的数据库中还可以找到数据集,这些数据集提供了对目录的额外访问。这很可能是在线提供的最广泛的海洋信息来源之一。
153. 事实性的
Factual 提供用于广告和移动平台上使用的位置数据。研究人员特别感兴趣的是开发人员工具,其中包括 Engine Mobile SDK 以及观察图的完整专业和研究应用程序以及本地验证堆栈。 Factual 的网站名称强调了该公司对获取世界各地数据并寻找将其置于背景中的新方法的热情,它对数据有明确的承诺,并寻找新的、非常规的机会来使用它。
154. 全球行政区域
全球行政区域是一个地理数据库,显示世界上各个行政区域的位置。从此类数据库收集的数据通常用于地理信息系统。其中包括国家,并进一步分为省、县和部门等。对于记者来说,好消息是所有这些数据都是免费的,也可以用于学术和一般非商业用途。
155. 地名
Geonames 是一个拥有地理数据库的网站,其中包含数百万个条目、独特功能和备用名称。该数据库提供导出选项和通过各种 Web 服务进行访问,每天处理大约 1.5 亿个请求。由于数据库的 wiki 功能,用户能够相对轻松地对数据库条目进行调整和更改。仅就多语言托管功能而言,这就是一个很好的资源。
156. 自然地球数据
Natural Earth Data 是一个可在公共领域使用的地图数据集,其中充满了设计用于地图制作软件以创建最先进地图的信息。最终产品的视觉效果整洁且组织良好,并且数据可以立即使用。该数据集包括情报数据以及各种文化、栅格和物理矢量数据主题。该数据集最初是根据制图师的需求和偏好而制作的,对任何对地理感兴趣的人都有用。
157. 开放街道地图
Openstreet Map 与其说是一个网站,不如说是用户之间的协作,现在为应用程序、网站和各种硬件设备提供地图服务。当用户输入不太知名的地标(例如火车站、道路和小径)的信息时,该网站会获取新数据。完整的数据集可在网站上免费获得,并且可以全部或部分下载。对于那些选择部分下载数据的人来说,也可以按区域下载。
158. 芝加哥市
芝加哥市是迈克尔·乔丹冠军公牛队的主场,拥有自己独特风格的披萨,并且还拥有自己的完整数据门户。数据集类别涵盖各种主题,包括行政与财务、道德、健康与人类服务、公园与娱乐、公共安全和历史保护。简而言之,芝加哥市的数据门户几乎包含研究人员、政策制定者和当地记者感兴趣的所有内容。
159. CKAN
CKAN 本质上是格拉斯哥市开放数据项目的在线主页。该网站拥有众多主题的数据集,可供企业家、政策制定者、学术研究人员和应用程序开发人员使用。这里托管的 360 个数据集中,有些与城市治理相关,例如房屋存量(按权属)数据集,而其他数据集(例如自行车数据集)是当地居民特别感兴趣的。这里为报道当地新闻的记者提供了各种各样的信息。
160. 印度政府
印度政府有一个网站,涵盖其开放数据项目版本中的分析和数据资源。目前,该网站上约有 137,940 个资源被浏览了数百万次。这些文件中的绝大多数也可以在网站上下载。无论是寻找政府预算数据还是寻找解决健康和家庭福利的数据集,该网站都有可能提供资源。
161. 南澳统计局
该网站充满了南非政府收集的最新统计数据、出版物和数据。在这里,研究人员将揭示从食品和饮料调查到经济指标、就业统计、人口数量和重要健康统计数据的各种信息。可以根据需要按城市、主题和指标搜索号码。该网站提供大量有关人口普查的信息,同时还发布统计出版物、调查问卷、代码和分类以及定价政策。
162. 政策制定和研究
该网站是在美国住房和发展部政策制定与研究办公室的领导下发布的。它每年定期出版大量案例研究、半年刊物和期刊。它还提供了记者感兴趣的大量数据集,其中公平市场租金、收入限制、更新资金通货膨胀因素只是公众可以在该网站上访问的几个数据集。
163. 重要的网络健康数据
在 Vital Net Health Data 中,研究人员会发现大量与健康相关的大型数据集。该站点并不是托管所有这些集合,而是提供人们可以访问并查找信息的集合的链接。该精选列表链接到 CDC Wonder、Eurocat、Health Data All Star 等资源,以及北美中央癌症登记协会等慈善组织的工作。这无疑是最全面的健康数据集资源之一。
164. 解析桥
Analytic Bridge 是专用于商业智能的资源。研究人员在这里可以找到有关机器学习和人工智能的讨论、网络研讨会和会议的链接,甚至还有求职选项卡。该网站还托管数据科学中心,这是该网站专注于大数据的部分。凭借其活跃和参与的社区以及对提供新闻和信息的承诺,对数据对商业的影响感兴趣的记者将从中获益匪浅。
165. 档案网
archive.org 主要因其努力成为在线公共图书馆而闻名,是众多已出版作品和大量数据集的所在地。该网站拥有 2012 年互联网普查结果以及 2011 年至 2015 年暗网市场档案,甚至还有 Reddit 公开评论数据集。有来自 Music Brainz 的数据转储和包含音频封面图像的数据集。 archive.org 的出版物和数据中有大量材料可供记者查阅。
166. 学术洪流
该网站将自己称为一个旨在使共享和下载海量数据集变得更容易的系统。学术洪流利用洪流技术来简化数据的分发,它以允许研究人员快速下载他们需要的所有内容而自豪。该网站还提供论文、课程和收藏以供查看。快速搜索可用资源将发现这里有大量数据集和集合可供下载。
167. 数据宇宙
处理 Dataverse 的最佳方法是将其视为另一种类型的库。在这里,研究人员可以轻松搜索、发现和引用数据,同时将该网站用作自己信息的存储库。涵盖的主题包括社会科学、农业科学、医学、健康和生命科学以及地球和环境科学等领域。在该网站上发表出版物的知名人士包括盖洛普 (Gallup) 和美国商务部、人口普查局、地理司。
168. 统一数据
加州大学数据与加州大学伯克利分校的社会科学数据实验室合作运营,是该大学最大、最著名的档案馆。该网站提供统计和社会科学数据领域的产品。在此站点上,研究人员可以访问 UC Data 研究人员撰写的论文、报告和工作论文。原始数据涵盖众多研究领域,包括医疗保健、福利和社会保险、人口统计、投票和信息技术以及许多其他主题。
169. 笑话营
Joe Kamp 提供了查找足球数据和 API 以进行数据分析的完整指南。如果研究人员点击页面上提供的链接,可以通过 GitHub 获取开源数据,并可以访问免费和商业 API,以便更轻松地访问。由于数据和编码可在 GitHub 等知名网站上获取,因此获取此类数据从未如此简单。
170. 肖恩·拉赫曼
肖恩·拉哈姆不一定是人们每天都会听到的名字,但他的网站是互联网上最全面、最深入的击球和投球统计数据的所在地之一。数据涵盖 1871 年至 2016 年期间,这些数据实际上可以追溯到几个世纪前。根据 Creative Commons Share Alike 3.0 许可证,数据可以免费访问和使用,并且可以直接在 SQL 和 Microsoft Access 等中下载。统计数据也可以通过 GitHub 下载。
171. 复古床单
Retro Sheet 是互联网上最广泛的棒球统计和数据来源之一。该网站包括年度名单以及裁判员、球员和教练的身份等详细信息。在相关的年份里,全明星比赛的数据以及一组季后赛的事件文件和一个小差异文件都包含在事件文件中。 Retro Sheet 甚至还提供了每个赛季的棒球场标识。怎么样才算是彻底呢?
172. Hubway 数据挑战
对于那些不太熟悉该计划的人来说,Hubway 是位于波士顿大都市区的自行车共享公司的名称。当然,系统并没有记录和发布识别信息,但 Hubway 仍然保留了 2011 年 7 月至 2012 年 9 月期间每一次出行的基本信息。其中包括行程的开始和结束等详细信息。接送站仅举几类。
173. 开放航班
Open Flights 是一个数据库,包含全球 10,000 多个渡轮码头、机场和火车站的信息。研究人员可以通过 GitHub 找到兼容 Excel 的 .csv 版本,也可以直接在网站上下载数据。使用主页上的地图,可以看到哪些特定地点在列表中,该网站甚至还提供可用的路线信息。可以联系网站所有者以获取更多更新信息。
174. 多层视觉系统
MLVIS 是一个将可视化分析与实时数据挖掘相结合的数据存储库。即使在处理巨大的数据集时,这也使得探索对数据更直观的理解成为可能。基准数据和非关系机器数据学习以及不同的数据类型(例如属性数据和异构数据)是该网站提供的众多功能和选项之一。为了更加方便用户,这些信息还可以下载为单一一致的格式。
175. 开放数据启动
Open Data Inception 网站提供了超过 2600 个数据门户的链接。通过使用顶部的搜索栏,研究人员可以按类别和主题搜索门户和数据集。此外,还可以使用该站点作为查找正在搜索的数据集的最新版本的方法。利用以列表格式或交互式视觉形式查看数据门户的功能,并开始查找必要的数据。
176. 开放数据软件
OpenDataSoft 有法语、英语和德语版本,可访问 4.8 亿条记录、400 万个 API 单元和 9,284 个数据集。使用主页中间的搜索栏,研究人员可以输入关键字或类别,然后从中找到最合适的数据集。对于记者来说,这是找到完成相关研究所需的最相关数据集的更快方法。访问该网站以了解更多信息。
177. 国家大师
NationMaster 是来自 300 多个国家/地区的完全编译数据的来源,这些数据已组织为 5,000 多个类别。这些数据涵盖的数字包括已登记的死亡百分比数字、第二次世界大战统计数据,甚至有关核战争和核试验的信息。研究人员还将找到表格、图表和饼图,以便进一步可视化数据。简而言之,涵盖的主题如此之多,以至于总能在数据中发现新的东西。
178. 追随者
Twitter 长期以来一直是一个流行的突发新闻和寻找热门故事的社交媒体网站。 Followerwonk 允许用户将 Twitter 的使用提升到一个新的水平。这包括寻找 Twitter 用户进行联系、研究当前关注者以及规划 Twitter 活动以获得最大效果。如今,推特上有很多记者和记者,他们使用该网站进行交流并发布故事。 Followerwonk 使 Twitter 用户在网站上的工作效率更高。
179. 信息黑猩猩
Infochimps 是一个提供基于云的服务的网站,这些服务可以缩减以充分利用大数据。它在部署和集成大数据技术和应用程序时非常有用。当研究人员搜索大量数据或评估大数据趋势时,这是一种非常宝贵的资源。该网站上还有大量白皮书和案例可供研究人员查看。
180. 存档的国家政府统计数据
Archive-It 成立于 2006 年,是互联网档案馆提供的一项服务。这项服务帮助组织和企业创建数字馆藏,因此有机会与非营利组织、学院、大学和政府合作。研究人员可以搜索该网站上的一些不同档案,例如 2014 年国会候选人竞选网站、阿拉巴马州档案馆和加拿大政府信息 PLN 网络档案馆。该网站是有进取心的记者的信息宝库。
181. 公民共享
Civic Commons 有一个页面列出了各种政府开放数据计划。这个可搜索的资源列表按国家、城市、地区组织,甚至还提到了政府间组织提供的资源。对于记者来说,该网站提供了一种更快的方式来了解哪些政府正在参与开放数据项目。该网站还允许访问一些本地化数据,这些数据不一定会在简单的 Google 搜索中出现。
182. 守护世界各国政府
《卫报》以其突发新闻而闻名于新闻界。很少有人意识到该网站有一个部分提供有关世界各地政府的数据。其中有关于无家可归人数影响的文章,关于网络安全的讨论,甚至还有关于数据和统计在当前政治和社会气候中发挥的作用的深思熟虑的讨论。 《卫报》的世界政府部分能够启动讨论并寻找故事的角度。
183. 开放政府数据(中心)
该网站隶属于开放知识基金会的一个组织,其目标是鼓励和支持开放政府数据的持续发展。在这里,用户将发现指向最广泛的可用开放数据目录列表之一的链接。在网站上提到的其他目标中,该小组还寻求有关政策、最佳实践和指南的信息。它为记者提供了获取更多更好信息的广泛途径。
184. 开放政府——法国
该网站是法国政府提供的开放数据项目的在线主页。可以通过在就业、农业、教育、旅行和旅游等类别下搜索来挖掘数据。这些数据可以让我们更细致地理解数据的实际含义,同时也为基于历史信息的比较留出空间。基本上,记者有充分的理由对这些数据感到兴奋。
185. 圣母大学
该网站存储圣母大学使用 SourceForge.net 提供的研究数据。数据通过关系数据库提供。每月的数据转储还可以更好地了解开源软件及其应用程序。为了访问此信息,必须通过电子邮件以书面形式提出访问请求。然而,问题是学术和学术研究人员是唯一有资格访问数据的人。
186. 不明飞行物报告
国家不明飞行物报告中心有一个在线数据库,详细记录了人们遇到不明飞行物的经历。研究人员可以通过使用日期、不明飞行物的形状、发布日期甚至州的四个类别中的任何一个来简化数据库搜索。不明飞行物是独一无二的,因为它们总是能激发公众的想象力。如果最近附近发生过第三种遭遇,可以在这里了解人们的言论。
187. 维基解密
由于争议以及泄密事件揭露了政府和社会上其他著名和有权势人物的内部运作,维基解密在媒体上臭名昭著,声名狼藉。尽管数据转储很少会悄然丢失,但没有人质疑信息的准确性。对于寻找立即引起兴趣的故事的记者来说,维基解密是一个经过验证的来源。如果不出意外的话,这将是一本有趣的读物。
188. 华盛顿邮报
该报纸已被认为是突发新闻和观点文章的绝佳来源,但很少有人知道《华盛顿邮报》允许访问其文章中经常提到的原始数据。在数据页面上,研究人员可以找到教育、人口普查、健康和安全、交通和发展、世界杯历史数据库等类别的数据,甚至与政府和政治有关的数据。简而言之,了解这些数字可以帮助人们对新闻中的问题有更具体的了解。
189. 气候数据
气候数据是提供全球温度综合信息的数据集。在当前格式中,用户可以通过网格查看每条重要的气候信息,同时还可以查看平均值。对于那些搜索伴随数据的人来说,也可以访问陆地和海洋的相同信息。这些信息可以下载,但为了方便起见,也可以直接在网站上查看。
190. 蛋白质结构
《蛋白质结构》是一个旨在研究计算机网络如何与生物学结合使用的来源。该页面托管一个存储库,其中包含可通过提供的链接访问的数据。研究界成员特别感兴趣的是该网站如何将模型分析和可执行生物学等多种想法融入到其对这一目标的追求中。对于记者来说,这个网站非常值得关注,可以观察进展并检查数据。
191. 免费分析调查数据
借助该网站,用户可以学习分析调查数据的课程,而无需付费。免费分析调查数据及其详细目录,包括诸如地图和调查艺术 – 加权维护、平衡受访者保密性与方差估计精度、结构方程模型 (SEM) 和复杂调查数据等标题的部分。该网站为那些预计将来处理更多统计数据的人提供了很好的复习机会。
192. 加州大学洛杉矶分校
在加州大学洛杉矶分校的维基站点上,研究人员将找到许多可用于演示目的的数据集。有大量模拟和观察数据可供选择。利用这些资源,人们可以利用这些资源来发现气候数据、人口数据、生物医学数据、神经影像数据、美国人口普查数据、选举数据和经济数据等众多其他类别。最终,这些数据集是许多人可以从中受益的资源。
193. 多伦多大学
多伦多大学在其网站页面上为研究人员提供了所谓的“Delve 数据集”的访问权限。这些数据集合是一个更大产品的一部分,该产品旨在对学习方法进行比较。最终,这些信息用于开发和评估不同的学习方法。简而言之,对于想要更好地了解如何分析和处理数据集的研究人员来说,这是一个可靠的来源。
194. 自然资源保护局
自然资源保护局有一个网站,专注于促进保护,同时提供有关美国境内不同苔藓、金鱼藻、维管植物、地衣和地钱的信息。该网站拥有完整的植物数据库和植物图像,可以在该网站上找到这些数据库以及大量信息。研究人员可以下载数据库并查找有关替代作物等主题的大量信息。本质上,该网站包含人们需要了解的有关植物的所有信息。
195. 农业研究服务
从该机构的名称可以推测,该服务满足美国农业部的研究需求。每当发现农业问题时,政府部门最有可能帮助找到解决方案。该站点托管许多可以直接访问和下载的数据集。记者还可以使用该网站查找与影响农业的问题有关的所有最新新闻。
196. 细胞图像库
该网站提供一个公共图书馆,提供资源、信息以及对描绘细胞和细胞过程的图像和动画的访问。该单元的设计考虑到了研究和教育的双重过程,这里的信息在公共卫生和疾病的讨论中几乎总是相关的。这些材料来自多种来源,包括历史和现代出版物。为了获得简化复杂生物过程的彻底解释,记者使用细胞图像库不会出错。
197. 完整基因组学
这是一家公司的网站,该公司认为自己是人类基因组测序领域生物技术领域的既定组成部分。有趣的是,Complete Genomics 已向公众提供了相当多的全基因组序列。最终,这为 DNA 和人类基因组测序提供了各种有用的见解。此材料的唯一条件是使用此信息的研究人员注意为 Complete Genomics 提供适当的参考。
198. 阵列快车
Array Express 是一个存储库,用于存储需要大量测序或处理的基因组学实验结果信息。在此网站上,用户可以找到超过 70,000 项实验的结果,以及数 TB 数据存储中超过 200 万篇论文。更好的是,这些信息可以免费重复用于研究目的。这是关于基因组学的所有最新信息以及该领域取得的进展的重要资源。
199. 编码
DNA 元素百科全书,或 ENCODE 联盟,是来自世界各地的研究小组相互合作的成果。最终目标是编制一份基因组所有功能部分的列表,其中包括仔细检查 RNA 水平、蛋白质、调节细胞的元件和基因活性。有可以搜索的数据以及提供更多信息的百科全书。
200. 整体基因组
Ensemble Genomes 是一个成立于 2000 年的网站,主要研究脊椎动物的基因组。多年来,该资源添加了有关无脊椎动物后生动物、植物、细菌和真菌的配套信息。通过单击网站上的链接可以找到和访问所有这些主题的数据。该网站提供了有关所有主题的教程、数据集以及可供浏览的文档集合。所有这些因素使 Ensemble Genomes 成为记者的绝佳数据源。
201. 基因本体联盟
基因本体论是一个网站,其存在的明确目的是寻找一种方法来代表当前对基因如何通过计算机运作的理解。它有许多出版物以及人们可以阅读的附加文档。网站上直接托管有注释。对于想要仔细研究数字和原始数据的研究人员来说,好消息是可以直接在网站上下载文件。
202. 基于集成网络的蜂窝签名库
哈佛医学院 LINCS 中心的存在旨在帮助研究界和公众更多地了解人体细胞在受到药物干扰时如何反应。使用 HMS LINCS 数据库和项目浏览器工具,研究人员可以找到出版物和项目摘要以及一般资源。记者还可以使用该网站获取本研究的所有最新新闻和信息。
203. 人类基因组多样性计划
在斯坦福人类基因组中心的努力下,人类基因组多样性计划取得了很大进展。该网站的样本有数千个样本和标记。事实证明,只需点击页面上提供的链接即可下载、观察和彻底分析这些内容。对于想要了解来自研究界的信息的记者来说,这是一个很好的资源。
204. JCB 数据查看器
JCB DataViewer 允许那些对《细胞生物学杂志》的内容感兴趣的人查看与该杂志发表的文章相关的图像数据。该网站有一个完整的画廊,人们可以滚动浏览以查看材料。此外,浏览者还可以选择在浏览网站时对数据进行进一步分析。简而言之,该网站非常适合了解期刊文章中的参考文献和图表。
205. 基因组数据共享数据门户
GDC 数据门户是一个旨在帮助研究人员和生物信息领域的人员更有效地进行癌症研究的平台。有一个档案、一个 API 以及可供阅读的文档等等。访问该网站意味着能够看到癌症研究人员用于进行自己的研究的相同信息。在这里,记者将能够找到他们想要的所有数据以及一些数据。
206. 开放式
Opensp 是一个社区支持的项目,旨在共享基因型。使用 FamilyTreeDNA、23andMe 或 deCODEme 进行输入的用户可以将该信息上传到该网站。要求人们这样做的目的是为了让网站能够专注于查看基因型和 SNP 或单核苷酸多态性之间是否存在联系。记者们特别感兴趣的是,人们可以下载并欣赏数据。
207. 路径指南
Pathguide 是一个致力于提供有关代谢和信号传导途径以及分子水平上蛋白质之间相互作用的信息的网站。此页面列出了大约 697 个与主题相关的资源。本网站链接的数据库通常都是免费访问的。此资源列表中提供的大多数参考文献主要关注蛋白质与蛋白质的相互作用。该网站对于生物学爱好者来说是宝贵的资源。
208. RCSB PB
该网站致力于向学术界和公众提供有关核酸和蛋白质的所有信息。 RCSB 蛋白质数据库提供各种旨在使生物学这一方面更容易理解的工具,包括可视化工具、3D 结构查看以及可按生物体类别分类的完全可搜索档案。此外,该网站还提供有关该领域所有最新发展的最新消息。
209. 精神病基因组学联盟
精神病基因组学联盟是来自世界各地致力于精神疾病遗传成分研究的研究人员和科学家之间合作的结果。最终,该项目产生了 17 篇主要论文和另外 31 篇开发论文,其中一篇具有里程碑意义的论文提供了二次分析和方法。该联盟根据要求通过数据访问门户提供工具、下载和调查结果的访问。
210. 酒吧化学
PubChem 在医学和生物研究领域是一个受人尊敬的名字,并且已经存在很长时间了。该网站提供结构搜索以及化合物、生物测定和物质数据库的功能,研究人员不会出错。此外,每个数据库中都存在数百万条条目。该信息可以通过 3D 构象工具和 BioAssay 工具等工具查看。该数据也可供下载。
211. 科斯米克
顾名思义,癌症体细胞突变目录(COSMIC)致力于记录和探索癌症体细胞突变的影响。该网站可以搜索按癌症类型、基因和突变分类的 COSMIC。 COSMIC 上有基因组浏览器、癌症浏览器等工具。此外,该网站还提供有关基因管理、耐药性、基因组筛选、突变特征和基因融合管理的数据可供下载。
212. 癌症药物敏感性的基因组学
癌症药物敏感性基因组学致力于寻找生物标志物,帮助医生识别患者更有可能产生反应的抗癌药物类型。记者可以使用新闻选项卡来了解新数据或网站更改的最新情况。此外,还有细胞系数据的汇编、记录癌症特征的数据库,甚至还有化合物列表,所有这些都可以在网站上查看。
213. 斯托尔斯医学研究所
斯托尔斯医学研究所的网站向公众研究成员免费提供其科学家、研究科学家和基因组科学家在其出版物中使用的数据。对于广大公众,该研究所煞费苦心地指出,斯托尔斯原始数据存储库通常是免费访问的。话虽这么说,数据库中的一些最大的文件可能无法简单地通过互联网直接访问,并且可能需要额外的安排。
214. SSBD数据库
生物动力学系统科学数据库(通常简称为 SSBD 数据库)提供了一套工具和资源,用于检查显微图像和评估定量生物数据。该网站上发现的图像来自多种来源,包括细胞、单分子和基因表达核等物体。由于该网站上的数据是通过计算模拟和实验获得的,因此记者可以放心,这里的信息会不断完善和更新。
215. 共享个人基因组
个人基因组计划是一个专注于创建向公众开放的健康、基因组和性状数据的网站。该网站主要在自愿公开其基因组信息的个人的帮助下继续该项目,并向公众免费提供其发现并成功获取的数据。除了科学之外,该项目还为记者提供了创建个人基因组信息公共记录的有趣视角。
216. UCSC 基因组浏览器
USCS 基因组浏览器允许个人查看基因组组装。除了在线查看之外,该网站还提供可用于下载相同基因组组装的序列和注释的链接。这些链接分为人类、哺乳动物、其他脊椎动物、后口动物、昆虫、线虫、其他基因组和其他下载等类别。该网站上的工具和目录也免费供个人和非商业用途。记者可以从这些信息的彻底性和可访问性中受益。
217. 尤尼普罗特
通用蛋白质资源(UniProt)是获取蛋白质测序和注释信息的地方。该网站利用 UniProt 参考簇、UniProt 知识库和 UniProt 档案中三个数据库提供的信息,配备了肽和簇搜索等功能。记者可以使用该网站来验证、发现和了解更多有关蛋白质测序和注释领域的新发现。
218. 精算师景气指数数据
精算师气候指数,也简称为 ACI,为公众和决策者提供有关加拿大和美国气候趋势和气候变化影响的信息。研究人员可以仔细研究这个教育工具提供的信息,以发现和发现海洋和天气的巨大变化。可以按区域和组件缩小搜索范围。该网站拥有数十年的数据可供使用,并且每季度定期更新其信息。
219. 航空气象中心
航空气象中心提供空域系统可以信赖的准确、及时和最新的天气信息。在此站点上,用户可以以飞行员可以欣赏的方式查看各种天气图表、预报和观测结果。可以通过 .csv 或 XML 输出实时查看站点数据源提供的信息。研究人员可以通过此下载选项更仔细地操纵和观察原始数据。
220. 气候研究室
气候研究中心网站的明确目的是对过去气候变化的影响进行研究,研究其原因,并找到当前气候变化问题的解决方案。在这里,人们可以阅读研究结果,可以通过信息表了解该主题的概述,阅读出版物,甚至访问原始数据。寻找原始天气数据集的记者很幸运能找到这个资源。
221. 欧洲气候评估和数据集
在欧洲气候评估和数据集的网站上,公众能够发现有关气候或天气极端变化的信息。研究人员可以选择使用该项目的研究工具(称为 KNMI Climate Explorer)来验证数据、检查季节性预测,甚至仔细研究厄尔尼诺现象以及其他应用的影响。由于该数据集每天都会更新,因此使用该来源的记者将是第一个了解极端气候变化迹象的人。
222. 全球影像浏览服务
全球影像浏览服务(简称 GIBS)是 EOSDIS 的重要组成部分,EOSDIS 是响应迅速且基于社区标准的影像服务提供商。换句话说,GIBS 允许普通人与从地球上几乎任何地方拍摄的高清卫星图像进行交互。由于 EOSDIS GIBS 是通过 NASA 的地球科学数据提供的,因此记者和研究人员比以往任何时候都更容易实时了解世界。
223. 白令海峡气候和生态系统
该网站在美国政府国家海洋和大气管理局的领导下运营,向记者和研究人员提供他们想知道的有关白令海气候和生态系统如何应对北极发生的变化的一切信息。在这里,可以阅读文章、回顾预测,并使用在线数据工具了解白令海的各种气候指数、生物、大气、海洋数据和野生动物的情况。
224. NCEI
NCEI,即国家环境信息中心,是美国国家海洋和大气管理局三个数据中心合并后的最终结果。该页面包含一系列链接,分为 22 个类别,将用户链接到不同的资源、感兴趣的页面以及气候和天气数据集。寻找有关气候、风暴、降水和许多其他天气问题的信息的记者很可能会在这里找到他们想要的东西。
225. 地球系统研究实验室
美国国家海洋和大气管理局的全球监测部门通过对关键大气指标的监测,提供有关地球气候变化力量的长期趋势的信息。例如,其中包括一氧化碳、甲烷、一氧化二氮和二氧化碳。然后,这些指标用于衡量长期臭氧消耗、二氧化碳来源和水平以及碳汇等。这是记者可以使用的气候变化资源。
226. WorldClim – 全球气候数据
曾经想要一种更好的方式来可视化气候数据吗? WorldClim 是一家提供免费数据的软件提供商,这些数据可用于空间建模以及创建地图。该免费软件的当前版本只能适用于当前的气候,而旧版本允许访问过去和当前的气候数据,还可以让用户看到未来气候预测的状态。记者只需点击链接即可下载该软件。
227. 知识发现实验室
知识发现实验室是一个致力于创新技术开发、机器学习基础知识以及这些知识在网络科学、欺诈检测和科学数据分析等实际领域中的应用的网站。该站点在 DBLP 中托管相当大的数据集,其中包含 120 万个对象和 248 万个链接。对于对知识发现实验室的目标感兴趣的研究人员来说,该数据集是一个极好的资源。
228. DIMACS 实施挑战
第九届实施挑战赛的网站旨在帮助研究人员学习如何解决最短路径问题。对于创建者来说,该网站的构建有两个目标。首先,找到最佳的可重复解决方案。第二,让研究人员能够轻松协作并发现更有效的解决方案。有兴趣了解这方面取得了多少进展的研究人员可以查看该网站上的论文和数据集。
229. 网络存储库
网络存储库是一个存储科学数据的站点,并添加了用户可以访问和分析的交互式可视化工具。该网站具有双重特点,既是同类存储库中的第一个,也是网络上最大的存储库。利用图形数据和直观、视觉上引人入胜的图像,进行比较和寻找新的数据关联方法要容易得多。记者可以使用此来源在科学数据中查找故事。
230. 帕杰克数据集
Pajek 数据集是一个提供数据集的页面,该数据集解决了芽殖酵母中蛋白质之间的相互作用。在对寻找检测相互作用的新方法的影响以及为什么能够辨别各种蛋白质与蛋白质相互作用的重要性至关重要的原因进行了简短的背景解释之后,该网站将观众直接链接到可供下载的数据集。要了解更多信息,研究人员可以单击底部的链接来阅读有关该主题的论文。
231. 美津网络数据
本网站旨在共享网络所有者使用和编译的网络数据集的链接。数据集的主题范围从美国大学橄榄球、政治博客和有关美国政治的书籍,到社交网络、悲惨世界和高能量的理论合作。有兴趣探索这些的个人将有大量感兴趣的数据集主题可供选择。另外,只要有参考资料,数据就可以免费使用。
232. 斯坦福图库
斯坦福大学 GraphBase 是斯坦福大学的 Donald Knuth 给一系列数据集和程序起的名字。当彼此结合使用时,这些程序和数据集能够操纵和生成图形和网络。在此网站上,所需材料可通过链接下载。在这些文件中,研究人员将找到足球比分数据、字典数据、有关蒙娜丽莎重建的数据等等。
233. Suite稀疏矩阵集合
SuiteSparse Matrix Collection 以前称为佛罗里达大学稀疏矩阵集合,是具有现实生活意义的矩阵集合。据该网站称,这个特定的集合在开发和改进稀疏矩阵算法时经常用于数值线性代数。用户往往喜欢该集合,因为它在运行和测试实验结果方面很有用。数据集和矩阵基准可直接在网站上下载。
234. 图数据集
该网页的创建者认为这是一组数据集,这些数据集要么是相关的,要么能够很好地转换为图形表示。图形数据集为想要学习如何使用原始数据的研究人员提供了预测毒理学挑战数据、IMDb 数据、诱变数据、MovieLens 数据、协同过滤和蛋白质数据等数据集。这些文件在此页面上提供,并且主要以 XML 格式提供下载。
235. 大数据新闻
大数据新闻是一个专注于大数据和数据科学基础知识的网站。该网站提供最新新闻,包括深度学习和人工智能的讨论。此外,大数据新闻还拥有庞大的数据集,总共包含约 35 亿个网页。这些都由分别称为页面级图、子域级图、第一级子域图和付费级域图的级别分隔。
236. 复杂网络与系统研究中心
CNetS,即复杂网络和系统研究中心,在印第安纳大学网络科学研究所和信息学与计算学院的领导下运作。该网站旨在成为数据科学、计算社会科学以及复杂网络和系统领域的资源,提供有关在线挖掘和流量模式的信息。此外,CNetS 还托管一个数据集,其中包含印第安纳大学用户发出的约 535 亿个网络请求。
237. 奥尼探索者
OONI Explorer 是网络干扰开放观测站的一部分,是一个致力于提供免费开源软件的项目。然后,用户可以使用该软件尝试阻止网站和消息应用程序以及其他应用程序。对这项技术感兴趣的人们特别感兴趣的是可以免费访问 OONI 收集的原始数据。只需将信息输入 OONI Explorer 并与其中的数据进行交互即可。
238. 机器学习的挑战
Challenges in Machine Learning致力于机器学习的研究和开发。在此网站上,读者可以找到软件、书籍、机器学习挑战的链接以及即将举行的研讨会的通知。该网站甚至提供了允许后期提交的挑战链接。对于有兴趣了解机器学习是否可以执行财务预测或网页分类等任务的记者来说,这是一个非常值得访问的网站。
239. 数据X
DataX 目前在 CrowdANALYTIX 的保护下工作,是社区驱动计划的机器部分,该计划利用集体的力量来创建定制人工智能、机器学习和神经语言编程应用程序。 DataX 在此过程中的作用是维护和部署,从而使这些解决方案具有可扩展性。对于需要整理大量文本、视频和数据的记者来说,通过 CrowdANALYTIX 和 DataX 提供的机器人可以将研究时间缩短一半。
240. 驱动数据
Driven Data 将众包与数据科学相结合,这是其他网站几乎没有的。该网站强调其在为应对不同社会挑战的组织提供帮助方面的作用,通过利用其庞大的数据科学社区来创建解决预测问题的统计模型来提供帮助。驱动数据似乎主要与非营利组织合作,但它对任何拥有需要精炼的原始数据的人都可能有用。记者牢记这一来源可以受益匪浅。
241.开放大数据
Dandelion API 是一个处理大数据语义文本分析的应用程序。对于拥有需要处理的数据的人来说,这意味着该程序将获取杂乱的文本并找到一种方法将其放入上下文中。正在解析大量文档的记者绝对可以从该功能中受益。 Dandelion API 还拥有米兰、特伦托和欧洲类别下的开放大数据。尽管此 API 是付费的,但每天都有一定量的文本可以免费分析。
242. 地球模型
地球模型专注于共享和存储与地球相关的软件和数据集。网站上提到的建模工具包括模拟软件和处理以及大量借鉴构造学和地震学等特定研究领域的虚拟数据。希望完善该主题知识的记者和研究人员可以使用该网站上的出版物和文章,然后再深入使用建模和可视化工具。
243. 社会经济数据和应用中心 (SEDAC)
社会经济数据和应用中心(SEDAC)是与 NASA EOSDIS 系统相关的数据中心之一。在此网站上,读者将找到提供气候变化数据或网格人口统计信息的数据集。数据集还可以按治理、农业、土地利用、健康、保护以及气候、水、遥感和贫困等主题进行搜索。研究人员还可以在该网站上访问提供更多数据背景的地图、图库、指南以及其他资源和工具。
244. AODN 门户
AODN 门户网站是澳大利亚海洋数据网络持有的网站,提供澳大利亚气候科学和海洋数据的访问权限。访问这些信息的研究人员还可以访问 IMOS 数据和元数据,这是包括澳大利亚政府在内的多个机构支持的研究框架。选择利用 AODN 门户的研究人员有望在直观的界面中获得出色的海洋数据交付。
245. 星球操作系统
Planet OS 提供了一个重点关注可再生能源的大数据框架。这种利基选择加上该网站的熟练程度使其受到能源公司的欢迎,这些公司正在寻求新的方法来可视化和情境化其数据。此外,该网站还拥有所谓的 DataHub,其中托管着 2,000 多个数据集的大量集合。这些数据集包括 NASA 和哥白尼的开放数据,并且这些数据通常会定期更新。
246. 史密森学会
史密森尼长期以来一直是一个受人尊敬的学术机构,并因其对研究和历史的承诺而受到全世界的赞赏。在某些方面,史密森学会拥有一个提供一些在线火山研究最佳信息的网站是很自然的。该网站发布报告、研究链接和数据库,其中包括缩小的火山、喷发、排放和变形搜索,以配合全新世火山列表和电子表格。记者不需要其他有关火山活动的消息来源。
247. 地震目录
地震目录由美国政府的地震灾害计划进行更新和维护,使研究人员能够了解地震上次发生的时间和地点。虽然搜索结果限制为 20,000 个,但目录搜索能够按大小、日期和时间,甚至按地理区域过滤结果。这种灵活性使得该资源对于报道自然灾害或当地地震并寻找一些背景信息的记者特别有用。
248. 美国经济协会
美国经济协会为研究人员提供美国和世界其他国家的宏观经济数据。该网站似乎并没有提供太多的经济数据,而是列出了一份最可靠的数据的简短列表。然而,鉴于互联网上有许多提供经济信息的网站,这是记者可以期望具有可信度的资源。只需访问该网站并点击相应的经济数据类别即可。
249. 历史统计网
Historicalstatistics.org 是一个非常有用的网站,可用于查找与当前形成有趣对比的经济信息类型。例如,该网站的历史货币转换器可以让研究人员了解 1923 年拥有 10 美元的人今天可以购买多少钱。它还主办出版物和论文,询问有关经济史领域使用的指标以及价格指数和可以按国家过滤的货币供应信息的问题。
250. 数据库经济学
如果互联网上的所有公共经济数据都可以从一个单一的可导航平台访问和搜索,结果会怎样? Db.nomics 是一个经济数据库聚合器,旨在实现这一目标。数据以 HTML、JSON 和 CSV 等格式提供,并会自动更新,同时相应地存档以前的修订版本。经济来源包括美联储、经济分析局、国际货币基金组织等。寻找信誉良好的经济数据的研究人员使用 Db.nomics 不会出错。
251. 联合外债中心(JEDH)
联合外债中心是通过国际清算银行、经济合作与发展组织(OECD)、国际货币基金组织和世界银行的共同努力开发的,为债务人提供有关债务数据以及国际债权人和债务人的信息。公众。正在研究不同国家的金融并试图更深入地了解国际金融格局的记者几乎可以在这里找到他们想知道的一切。
252. 国际贸易数据
国际贸易数据页面汇集了领先经济专家乔恩·哈夫曼 (Jon Haveman) 的完整输入,提供了可以下载和进一步分析的数据。数据集包括关税数据、Penn World 表、公用事业、进口数据、制造业生产率、商品分类、Rauch 产品差异化代码、NBER 数据、1997 年商品流动调查、贸易和移民以及有用的引力模型。 UNIX 是用于编译这些数据的操作系统,但该网站指出 PC 也应该能够访问这些数据。
253. 开放企业
在 OpenCorporates 上,研究人员可以轻松地搜索和查找全球最大的公司开放数据库之一的信息。然后,世界各地的不同团体(例如银行、调查人员、非政府组织和记者)利用这些信息来获取情报和信息。记者还有一个额外的好处,那就是能够借助 OpenCorproates API 以及通过批量核心数据或其他核心数据集实时访问数据。
254. 我们的数据世界
我们的数据世界从各个领域的多个来源获取信息,并提供相关的量化数据。从女性劳动力参与率的数据到公共部门普遍腐败认知和全球收入不平等的信息,如果这个主题可以用数据来讨论,这个网站可能会有一个条目。记者可以使用此来源查找与社会问题相关的统计数据和数字。
255. 巴黎科学学院
巴黎政治学院,或者更常见的政治研究所是一所在社会科学领域具有不可否认影响力的学校。在这种情况下,蒂埃里·梅耶尔的页面包括数据文件,其中包含来自“让贸易不要战争”的重力和军事冲突回归数据以及市场潜力数据集等。希望更好地了解学术期刊得出的结论的记者在浏览该网站时会发现大量信息。
256. 国际数据中心
自1999年成立以来,国际数据中心一直致力于收集、创建、改进和发布线下和线上国际经济数据。在该网站上,读者可以访问美国关税数据、世界和美国进出口数据,甚至宾夕法尼亚世界表中的信息。随着这些信息向公众开放用于教育和研究,记者可以免费访问和使用这些数据。
257. 经济复杂性观察站
经济复杂性观察站(通常称为 OEC)允许研究人员、学生、经济学家和任何其他人可视化国际贸易数据。凭借其引人注目的主题和交互式界面,该网站为研究人员提供了一个以前所未有的方式探索国际贸易信息的合法机会。对于那些喜欢在搜索时看到经济数据变得生动的记者来说,OEC 是一种宝贵的资源。
258. 大学记分卡数据
高等教育是许多圈子里的热门话题,学生和家庭都想了解学校的情况以及学生的学习情况。通过其大学记分卡数据,美国教育部为教育工作者和学生提供所有这些信息以及更多信息。这些数字涵盖 1996 年至 2016 年,包括当前数据、记分卡数据、毕业后收入以及新的国家学生贷款数据系统信息。这是记者一定要使用的最新高等教育来源。
259.商业建筑能源数据集
作为一个主要处理能源的数据集,COMBED 自然具有独特性。再加上它的数据来自商业建筑时每分钟更新多次,很明显这个数据集是独一无二的。对于记者来说,在准备有关能源消耗的文章时,这些信息非常有用。访问 COMBED 的数据就像下载并打开 Excel 电子表格一样简单。
260.DRED 数据集
DRED 数据库的 DRED 部分代表荷兰住宅能源数据集。正如标题所示,该数据测量和研究一个荷兰家庭将消耗多少能源。从 2015 年 7 月 5 日到 2015 年 12 月 5 日,环境、入住率、电力和一般家庭信息均在该数据集中进行了监测。任何研究能源消耗的记者都会从查看此处提供的原始数据中受益。下载 CSV 数据的说明可以直接在网站上找到。
261. 生态数据集
ECO,代表电力消耗和占用,是一个由分布式系统集团运营和运营的项目。该项目的前提是研究人员在 8 个月的时间里监测六个瑞士家庭的负载并检测其占用情况。该网站提供对该信息以及相关出版物的说明和链接的访问。由于该网站的可视化交互式仪表板,记者应该可以毫无问题地将研究转化为引人入胜的内容。
262. 印度环境水和能源数据集
IAWE 代表印度环境水和能源数据集,创建的目的是通过电器、电表和电路板的电力测量来监控新德里家庭的能源使用情况。由于停电、供水差异、数据包丢失和电压波动,iAWE 遇到了跟踪印度能源使用情况所特有的问题。对于记者在讨论能源使用模式时来说,这是非常有用的数据。
263. 英国家用电器级电力
英国家用电器级电力(UK-DALE)是一个数据集的名称,该数据集监控和记录五个家庭的电力需求量。每六秒,UK-DALE 就会测量一次主电网以及房屋内各个电器的需求。有兴趣了解英国家庭如何使用能源的记者绝对可以使用 UK-DALE。数据是可访问的,并且有一篇描述该系统的论文可供阅读。
264. 地理信息系统
ArcGIS Hub 是一个平台,组织和个人可以使用该平台通过站点范围内的计划来实现目标。该网站提供页面模板、分步指南和可供查看的示例,对于雄心勃勃的社会推动者来说是一个极好的资源。与此同时,“开放数据”选项卡下的可用信息仅包含“灾难”类别中的数百个数据集。无论记者是在研究数据还是贡献数据,ArcGIS Hub 的用途都不止一种。
265. 剑桥地理信息系统
剑桥 GIS 是马萨诸塞州剑桥市的开放数据存储库。除了太大而无法通过此 GitHub 存储库下载的文件外,该城市的大部分数据集都可以在此页面上找到。这里提供的单个数据集包括商业区、地役权、分区、人口普查结果、墓地以及其他可以通过数据量化的地标和特征。挖掘当地信息的记者可以在这个网站上找到他们想要的一切以及更多信息。
266. 地理维基网
作为一种资源,Geo-Wiki 是一个致力于所谓的“公民科学运动”的网站。在这里,鼓励公民尝试监测环境。研究人员可以在侧边栏中找到最新新闻以及出版物名称以及免费数据集和软件下载。该网站提供的工具包括地图、个人数据上传、验证和黑客马拉松,这些工具可以以 Excel 格式和 zip 文件下载。
267. 打开街道地图
OpenStreetMap 数据摘录来自 OpenStreetMap 项目,该项目正在进行中,旨在通过全球用户社区的编辑和努力来创建世界地图。为了开始使用此数据源,内容发布者需要做的就是选择他们的首选大陆,然后找到他们的首选国家/地区。下载此 Geofabrik GmbH 是免费的,并且数据通常每天更新。
268. HIFLD 开放数据
HIFLD 由国土安全部运营和维护,用于国土基础设施基础级数据,将地理空间数据置于公共领域。分发这些数据的明确目的是为社区的研究和准备提供支持和信息。该数据可以下载到 Shapefile 和 CSV 中,也可以在网络上查看。对于出版商而言,HIFLD 开放数据使地理空间数据比以往更加直观、更具吸引力。
269. 开放地址
OpenAddresses 专注于地址基础设施和收集。该网站主要依靠社区的努力,使用 GitHub 作为其开发平台。在这里,人们可以将地址添加到数据库后将其放置在地图上,也可以获取数据并立即开始地理编码。由于所有数据和地址都是开放的,并且只需要归属,定期的数据更新和地理编码进步的潜力使 OpenAddresses 成为一个非常有趣的项目。
270. 开放数据 LMU
开放数据 LMU 严重依赖 OpenStreetMap 的数据来帮助开发快速反向地理编码器。这意味着该应用程序能够快速获取地图上的位置并根据该点找到完整的地址。这也可能适用于社区和县。该网页包含大量与应用程序相关的链接,其中包括源代码、数据集以及 OpenStreetMap 查找表和分辨率。
271. 环境数据浏览器
通过环境数据浏览器,记者、研究人员和学生可以下载和探索联合国环境规划署及其附属组织和合作伙伴使用的相同数据集。搜索可以按地区缩小范围,并使用 500 个过滤器中的任何一个或全部进行。此外,数据集还包括健康、GDP、气候、排放和淡水等类别,可以在网站上以图表、表格或地图的形式直接查看。
272. 非洲开发银行集团
非洲开发银行集团的网站是记者寻找与非洲大陆相关的统计信息和指标时的第一站。用户滚动浏览数据目录可以按来源、主题和区域过滤数据集。对于任何想要深入了解当前主题的人,该网站还提供了一系列令人印象深刻的出版物的链接,其中包括《非洲经济展望》和《非洲统计年鉴》等出版物。
273. 基因组数据共享 (GDC)
NCI 的基因组数据共享中心是网络上最全面的癌症数据存储库之一,专注于癌症基因组研究领域。该网站的数据门户包含数千个病例,涵盖 38 种疾病和 39 个项目,并且可以免费访问。由于数据提交主要由机构和研究人员提交,因此这些信息的准确性使其成为记者随身携带的理想数据源。
274. PhysioBank 数据库
PhysioBank 数据库通过公共领域向个人提供生理数据。这些数据库分为波形和临床两大类。波形子类别包括图像、心跳间隔数据库、合成、步态和平衡、心电图和多参数数据库。由此产生的纯粹信息包括床边生命体征数据、氧饱和度甚至心血管疾病的数据。研究人体的记者和个人可能会在这里找到一些信息。
275. 医疗保险覆盖数据库
医疗保险覆盖数据库由医疗保险和医疗补助服务中心通过卫生与公众服务部维护,为研究人员提供了获取大量医疗服务信息的完整途径。其中有关于慢性病、药物支出、电子临床模板、债务追收系统以及研究和示范拨款的信息可供阅读。对于直接从来源获取的数据,这是同类在线网站中最全面、最全面的。
276. 开放支付数据
当大多数人去看医生时,他们通常不会坐下来思考他们的初级保健医生在与医疗保健制造商合作后是否能获得经济利益。 Open Payments 向公众通报医生或医院从公司收到的任何膳食、研究、礼品、演讲费和差旅费。寻找有力报道的记者可以使用数据浏览器查看信息,也可以单击选项卡直接下载数据。
277. Flickr标志
它的部分内容写在名称中,但 FlickrLogos 指的是由在各种不同位置拍摄的公司徽标组成的数据集。该集合由奥格斯堡大学多媒体计算和计算机视觉实验室维护,最初编译的目的是训练计算机识别徽标和文本。为了及时了解这个具有新闻价值的程序所取得的任何进展,下载该数据集并查看其内容不会有什么坏处。
278. 图像网
ImageNet 是一个包含由 WordNet 组织的图片的数据库。该网站上有年度挑战赛,即使在关闭后也可以查看,这些挑战赛的重点是创建能够执行指定任务的算法。 ImageNet 也是众多出版物、引文和幻灯片的所在地。以技术为导向的内容出版商有充分的理由使用浏览器选项来理解 WordNet 结构和云地图。
279. 斯坦福狗数据集
斯坦福狗数据集包含大量不同犬种的图片和图像。这个基于 ImageNet 的数据库包含 120 种不同品种的狗以及 20,000 多张单独的图像,为研究人员提供了大量的图片供研究人员使用,同时教机器如何识别每种狗的品种。在该网站上,可以单击讨论使用数据集来教授计算机图像识别的不同出版物的链接,并随数据集下载一起阅读。
280. 太阳数据库
SUN 数据库是一个项目的网站,该项目旨在让研究界在计算机视觉和图形、数据挖掘、机器学习和神经科学等领域取得进展。该网站的索引中拥有超过 131,000 张图像和近 4,000 个对象类别,内容非常全面。对于对该数据库以及研究人员在使用该数据库时能够做的事情感兴趣的出版商来说,这是一个值得探索的数据源。
281. Oxford-IIIT 宠物数据集
Oxford-IIIT Pet 数据集是一个网站,可作为 2012 年 IEEE 计算机视觉和模式识别会议上发表的论文的补充,并托管用于该论文的原始数据集。这些图像已被组织成大约 37 个宠物类别,以及与所涉及的每个类别相关的另外 200 张图像。此外,这些数据可以通过网页上的链接直接下载。
282. 视觉基因组数据集
Visual Genome API 是斯坦福大学几位学生和副教授辛勤工作的最终成果。该程序在创建能够评估和描述图像的 API 方面发表了多篇论文,已成功回答了超过一百万个问题,同时评估了超过 100,000 张图像。该 API 代表了计算机科学及其相关领域的进展,数据集可以直接在网站上下载。
283. YouTube 面孔
YouTube Faces 数据库专注于开发视频中自动面部识别问题的解决方案。该数据集总共包含来自 YouTube 的 3,000 多个视频,涉及近 1600 个人,平均长度约为 181 帧。最终的目标是创建一种能够创建标签来识别视频中的人的算法。数据以及错误信息以及描述方法都可以直接在网站上查看。
284. KEEL-数据集存储库
KEEL 数据集存储库包含基于 Java 的开源软件的数据集,旨在帮助各种类型的知识数据发现。 KEEL,简称为基于进化学习的知识提取,可以通过训练来学习如何添加缺失值、混合模型和统计方法,以在许多其他任务中评估实验。数据集下载以及 KEEL 中算法的完整列表可以直接从网站下载。
285. 借贷俱乐部
Lending Club 的成名之处在于其作为点对点贷款机构的地位,允许借款人获得贷款,即使他们不一定具有从传统贷款机构借款的信用评分。除了网站运营方式的新颖性之外,它还提供统计数据,包括平台亮点、拒绝的贷款信息、投资者表现数据,甚至包含历史数据的数据字典。这些数字通常从 2007 年开始,可以 CSV 格式下载。
286. 自然历史博物馆
自然历史博物馆被许多人认为是世界上最知名的博物馆之一,但数字化和通过开放数据门户检查其目录的能力对很多人来说可能是新闻。拥有 91 个数据集,其中包括微化石和化石藏品以及索引批次记录等材料,这些数据向公众开放,并以多种格式免费下载。
287. 盖蒂词汇
该网站非常适合在描述和分类某些艺术、艺术家姓名、建筑、材料和地理名称时希望遵循某些风格准则的记者和出版商。该网站将用户直接链接到研究人员和编目人员需要了解的受控词汇数据库,以便满足国际标准。至少在这方面,盖蒂词汇表无可匹敌。数据集可以通过文本或 SPARQL 进行探索,也可以通过网站下载。
大多数人听到 CSI 这个词时可能不会想到 CLiPS 文体测量调查语料库,但 CSI 语料库仍然是由学生评论和学生论文组成的数据集。除了文本本身之外,网站还指出文档中嵌入的元数据和信息具有多种用途。该语料库根据知识共享许可提供和分发,作为使用数据集的交换条件,所要求的只是归属。
289. 通用依赖项 v2
通用依赖项 v2 是指通用依赖项项目的第二个更新版本,该项目致力于开发可与多种不同语言一致使用的树库注释。在更新版本中,研究人员将找到数十个不同语言的 UD 树库,包括南非荷兰语、古希腊语、日语、荷兰语、芬兰语和英语之外的中文。可以在此网页底部附近找到并下载最新版本的通用依赖项。
290. 网管
Webhose 是直接从网站的存储库获取并向公众开放的一流数据集来源。研究人员可以按语言对新闻文章进行排序,阿拉伯语、法语和荷兰语只是文章数量超过 100,000 条的几种语言。此外,英文新闻文章还进一步细分为娱乐和体育等类别,以配合评论和论坛帖子。数字出版商和研究人员可以从探索这些数据集中受益。
291. 维基数据
对于出版商和研究人员来说,维基数据是一个被低估的内容和想法来源。根据此页面,有多种方法可以访问数据转储中的材料,尽管该网站最强烈推荐使用 JSON。此处提供的所有数据均可完全免费用于非商业和商业用途,可根据知识共享许可免费访问和下载。
292. 维基链接
Wiki Links 位于 Google 代码的框架内,是一个开源项目,旨在为个人提供访问特定的、独特的数据集的权限。在此网页上,研究人员可以下载自述文本、数据文件和知识共享许可证。出版商或一般以技术为导向的个人在浏览这个庞大的数据集时有很多值得期待的地方。只需浏览该网站,单击并开始下载文件。
293. 词网
WordNet 是一个英语词典,由语言、副词、名词、形容词和动词组成,这些成分被分为不同的组,然后用于表达特定的想法。最终结果是一个有用的工具,可以根据单词的使用方式和含义而不是发音时的发音对单词进行分类。 WordNet 在语言编程中的应用以及该网站上提供的大量出版物和统计数据都得到了关注。
294. 艾伦大脑图谱
艾伦脑图谱由艾伦脑科学研究所创建,是一种研究和了解更多关于人类大脑及其在人体健康和疾病时如何反应的工具。利用该图谱,研究人员可以了解人类大脑及其发育、胶质母细胞瘤和癌症对大脑的影响。报道这些主题的记者可以访问该网站获取数据集和信息。
295. 国家硝化研究中心
NITRC(神经影像信息学工具和资源交换所)是记者和出版商可以获取神经影像的地方。该网站作为神经影像数据共享计划进行整合和推广,拥有来自多个项目的数据,例如 1000 连接组项目、成瘾连接组预处理计划以及 INDI 前瞻性和回顾性项目。个人可以通过网站免费下载数据。在各个阶段拍摄的神经图像从未如此容易获得。
296. HCP 青年人
人类连接组计划青年项目是一项持续努力的延续,旨在创建大多数正常成年人中所见的人类连接组的准确图谱。通过两个阶段,通过静息态功能磁共振成像和扩散成像技术的组合对 1200 名健康成年人进行了扫描。记者和出版商在寻找有关大脑的信息时找不到另一个网站,其中包含更多有关健康年轻人的人类连接组的数据。
297. NIMH 数据档案
NIMH Data Archive(简称 NDA)与其说是一个独立的数据源,不如说它是一个分发和存储数据的平台。该网站上提供了在多篇论文和研究项目过程中收集的数据,并提供了可实现更好分析和协作的方法和工具。数据摘要是免费提供的,报告最新科学的内容提供商可以使用这些信息来发布突发新闻。
298. 神经数据
NeuroData 致力于研究心灵和大脑之间的独特关系。由于该网站致力于开放科学和可重复研究,内容提供商可以通过网页上的链接访问出版物和多个数据集。对于那些希望亲自查看数据的人来说,他们特别感兴趣的是免费代码和分析工具的可用性,这些工具使探索 NeuroData 的工作变得更加简单。
299. 神经电学
NeuroElectro 项目的设计目的是收集与不同神经元类型相关的各种电生理特征并将其聚合到一个数据库中。该项目旨在研究神经元之间的关系,以研究各种神经元类型之间的差异。该网站链接到文章并列出了迄今为止发现的神经元类型和电生理学特性。内容提供商可以依赖该网站作为神经元与神经元关系的数据源。
300. 影像研究开放获取系列
成像研究开放获取系列(也被许多人称为 OASIS)是一个项目,其设计目标是使整个科学界能够访问脑部 MRI 数据集。记者和研究人员可以访问比较成人之间 MRI 数据的出版物,以及 OASIS 综合论文中比较和对比 400 多名受试者的结果的综合情况说明书。信息和工具可以多种格式从网站下载。
301. 开放式磁共振成像
对于那些想要访问 MRI 数据集而又不想与其他网站相关的任何麻烦的记者来说,OpenfMRI.org 致力于让公众可以访问 MRI 数据集是一个积极的发展。该网站直接来自研究人员本人,拥有各种数据集,例如分类学习数据集、混合赌博任务和气球模拟冒险任务。数据的多样性和数量使研究人员能够通过该网站找到新的探究途径。
302. 学习福雷斯特
“研究福雷斯特”的名字很大程度上借用了著名电影《阿甘正传》,旨在了解大脑在应对自然但同样复杂的刺激时必须以更高水平执行时的能力。即便如此,该网站承认从这些研究中收集的功能磁共振成像数据的应用范围比最初看起来更广泛。内容提供商可以浏览使用了Studyforrest数据的 19 种出版物,甚至可以直接访问数据。
303. 晶体学开放数据库
正如标题所示,晶体学开放数据库收集了 385,697 种金属有机矿物和化合物、有机和无机晶体结构,但生物聚合物除外。希望了解有关晶体结构的更多信息的内容提供商可以按结构式进行搜索,或运行带有浏览选项的匹配搜索查询。该网站上还有软件和数据,使得该网站在化学领域特别有价值。
304. 美国宇航局系外行星档案
长期以来,美国国家航空航天局 (NASA) 一直被认为是外太空信息的主要来源之一,它的系外行星档案延续了其作为宝贵资源的传统。该网站拥有一系列交互式工具和软件,例如凌日和星历服务、周期图、确认行星绘图工具以及交互式上传文件和搜索表格的功能。寻找独特见解的内容提供商可以在下次系外行星碰巧制造重大新闻时使用这些数据。
305. 斯隆数字巡天
在斯隆数字巡天(SDSS)的帮助下,任何人都可以创建宇宙的三维地图。记者和内容提供商等可以访问算法、成像数据、数据集、教程和视觉材料的进一步开发,以正式和非正式地教育公众。该网站还明确讨论了如何通过新闻和社交媒体向公众提供其数据。对于内容提供商来说,这是一个非常宝贵的视觉工具。
306. 统计科学网
Statsci.org 提供了一个全面的资源列表,公众可以根据自己的特定需求访问和使用这些资源。其中一些信息包括电子数据集服务和加州大学洛杉矶分校编制的案例研究。除了原始数据集之外,此页面上还链接到教科书。这包括《小数据集手册》和《生物测定案例研究》等书目。寻找统计数据的内容提供商看看这个不会出错。
307. 埃里克
ERIC,也称为教育科学研究所,是一个资源,可以作为任何寻找教育领域信息的人的搜索引擎。初步搜索甚至提供专门过滤同行评审信息以及基于 ERIC 的全文的选项。鉴于教育预算和教学方法出现在新闻中的频率,这是记者应该牢记的数据来源。
308.NTIS
NTIS(国家技术信息服务)是在第二次世界大战结束后不久创建的,其目标是利用数据帮助联邦机构通过使用数据做出基于数据的明智决策。该机构原本是美国政府在科学研究领域的数据存储库。如今,该网站拥有数以百万计的各种主题的出版物。仅历史信息就使该网站非常值得作为记者和出版商的数据源。
309. 开放数据证书
ODI(开放数据研究所)的网站是所谓的开放数据证书的所在地,这是一种在线提供的免费工具,其开发的明确目的是严格检查和认可开放数据的质量。从出版商或记者的角度来看,该网站还托管大量主题数据集,从资助列表到过敏警报,以及可以 CSV 格式下载的列表。
310. GitHub 存档
GitHub 很容易成为互联网上最受欢迎和最知名的数据存储库和档案库之一,因为它易于协作、存档容量和编码方面的可访问性。无论是尝试创建可以执行某些任务的机器人,还是开发应用程序,GitHub 都是一个内容发布者和记者可以轻松发现具有潜在新闻价值的产品的网站。可以按照 JSON 或 Big Query 的教程说明来访问存档。
311. 社会模式
SocioPatterns 是一个专注于通过数据寻找人类活动和社会动态模式的项目。正如对如此广泛的既定目标所预期的那样,该网站的信息已被用于出版物,涉及从疾病传播到有关个人在线和离线角色之间差异的案例研究等一系列主题。这些数据集可供查看,已发表的论文也包含出版商可能在某一时刻发现相关的信息。
312. 独立地图
Indie Map 是从超过 2,000 个 IndieWeb 最繁忙的网站获取信息并将数据转化为交互式视觉形式的结果,例如社交图谱 API、具有 SQL 查询功能的数据集以及在总共 5.7 个网站上爬取的原始信息。万个网页。对开源软件以及这些数据可能对这些在线社区有何影响感兴趣的数字出版商可以直接从网站访问这些信息。
313. 西蒙弗雷泽大学
西蒙弗雷泽大学继续巩固其作为著名大学的地位,提供有关“YouTube 视频统计和社交网络”的数据集。这些文件从使用 YouTube API 查找视频的爬虫中获取信息,包含数百万个视频和用户信息数据集的数据。该网站指定数据集下载仅用于学术目的,但可以通过该网站找到有关该项目的新闻来源和参考资料。
314. ACLED
ACLED(武装冲突地点和事件数据项目)提供有关发展中国家抗议和政治暴力的公共数据。这里提供的信息包括死亡人数、暴力或抗议的日期和地点信息、相关团体的名称以及已发生的骚乱和暴力冲突的数据。 ACLED 提供对定期报告、出版物和视觉效果以及可在网站上下载的数据的访问。
315. 加拿大法律信息研究所
加拿大法律信息研究所(通常称为 CanLII)是一个网站,提供免费访问雕像及其法规、各个司法管辖区法院(包括加拿大最高法院、省法院和上诉法院以及女王法院)的判例法的网站。法官,以及各个行政法庭和法定机构的裁决。该网站有 301 个判例法数据库和超过 140,000 份法院判决可供查看,报道法律主题的记者和数字出版商将受益于为此网站添加书签。
316. 系统和平中心
系统和平中心(CSP)是一个致力于分析全球系统以解决政治暴力问题的组织。在这个网站上,从事这一领域研究的记者将能够获得对非洲冲突、全球冲突趋势等的分析,以及该组织三份主要出版物的摘要,例如第三次世界大战和 CSP 的全球报告和虚拟报告。图书馆。
317. 战争相关项目
战争关联(COW)项目的重点是帮助收集和分发国际关系领域的定量数据。 COW 恪守将科学原理应用于国际关系数据的承诺,向公众免费开放其数据集。这些数据库包含记者和研究人员可以使用的信息数量,例如国家之间的军事冲突、国家系统成员、国家物质能力和正式联盟。
318. 欧洲社会调查
欧洲社会调查(ESS)是一项在欧洲各地进行的调查,旨在衡量不同国家不同人群的不同行为模式、态度和信仰。由于记者通常有兴趣了解公众的意见,因此 ESS 头条系列涵盖的主题包括欧洲人的个人和社会福祉、对福利的态度,甚至英国存在的年龄歧视,可以在更多方面支持报道方式多于一种。
319. 和平基金
和平基金是一个通过开发可用于缓解冲突的工具来预防冲突并专注于安全的组织。在 FFP 的职业生涯中,它一直与记者、非政府组织、当地组织、国际同行以及政府合作。无论是寻找趋势、比较分析还是全球数据,记者和出版商都可以通过网站的浏览器内数据探索工具找到他们想要的材料。
320. 综合社会调查
综合社会调查 (GSS) 的工作重点是收集现代美国社会各个方面的信息,以此了解人们的态度和行为趋势及模式。这种趋势跟踪实践可以追溯到 1972 年,对于想要探索趋势的记者来说,历史数据本身就是一座金矿。使用 GSS Data Explorer,研究人员和记者能够下载、检查甚至评估数据。
321. 盖西斯
GESIS 是一家致力于社会科学的德国基础设施研究所。它提供不同的社会科学以及研究工作和服务,范围从调查方法到应用计算机科学、数据收集、研究计划和数据分析,等等。对 GESIS 方法论、高素质移民的利用等主题感兴趣的记者可以在出版部分找到大量信息。
322. 全球宗教期货
从堕胎到性教育等话题,宗教是如此普遍,以至于即使在很大程度上世俗的国家,一个人在困难的社会问题上的立场也会受到宗教信仰的影响。在《全球宗教未来》中,皮尤研究中心研究了人们与全球宗教相关的态度和信仰的趋势。想要研究福音派对政治的影响或对石刑的态度等细节的记者可以使用数据浏览器在数字中找到答案。
323. 风险管理指数
风险管理指数,也称为 INFORM,是研究人员和记者在存在人道主义危机或灾难风险的情况下可以进行风险评估的地方。该组织提供儿童死亡率、性别不平等指数、干旱频率等主题的数据链接。还可以查看和下载 INFORM 的数据或通过网站的交互式地图访问它。
324. 独立非执行董事
INED(法国人口研究所)是记者可以在互联网上找到的最丰富的数据和统计数据来源之一。每年有超过 70 种出版物被研究和出版,以图表形式展示世界人口情况,以及衡量性别生育率差异等问题的统计数据,以及新闻和资源方法。研究人员若想从信誉良好的来源寻求准确的发现,将通过独立非执行董事找到它们。
325. 国际网络档案
普林斯顿大学的国际网络档案馆提供独特的出版物组合,其中包括《1999 年人类发展报告》和《全球网络:跨国事务杂志》等研究成果,可供在该网站上阅读。在这个网站上,记者将能够仔细研究档案馆的全面公共历史和最新数据。这里涵盖的主题包括医疗保健、武器、书籍、音乐、移民、地区、互联网、政治和交通,这些只是研究人员可以在此处仔细阅读的材料的示例。
326. 国际社会调查计划
国际社会调查计划(ISSP)从一开始就作为不同国家人民之间合作的手段而成立,每年都会对社会科学领域的各种重要主题进行调查。多年来的主题包括社会不平等、国家认同、公民身份、社交网络和工作导向等。 ISSP 的调查结果可以按年份或主题搜索,并可以在网站上相应下载。
327. 国际研究协会
国际研究协会 (ISA) 汇集了来自国际研究协会 (ISA) 的研究人员、学者和政策专家的专业知识,旨在帮助记者或其他研究人员就与跨国、国际和全球事务主题相关的问题进行信息丰富、知识性的讨论。其他名称。 ISA 的《国际研究百科全书》收录了经过同行评审的论文,其中充满了对该领域研究主题的深入讨论,以及提供从更历史的角度讲述信息的论文。
328. 网络上的跨国数据
卫斯理大学 (Wesleyan's University) 教授詹姆斯·W·麦奎尔 (James W. McGuire) 的页面非常有用,其标题恰如其分,名为“网络上的跨国数据”,是一个资源页面,其中充满了相关经济和全球发展数据的链接。记者在这里可以找到的数据集包括计划生育、教育成就、营养不良、水和卫生设施、自由市场导向以及拉丁美洲和加勒比地区的特定信息,仅举几例。这里列出的数据源是无可挑剔的。
329. 挪威研究数据中心
挪威研究数据中心是一个支持和帮助不同领域的研究人员进行实证研究的机构,例如隐私、数据收集和分析、方法评估以及研究伦理。在这里,研究人员将找到该中心开发和推荐的软件和工具,以配合大量可免费访问的区域、个人和机构数据。该中心在研究和隐私年度报告中的发现也总是很有趣。
330. IPUMS
IPUMS 不一定是大多数人听到这个术语时所期望的数据源,但它对于记者来说仍然是一个有用的来源,因为它充当其他实体提供的数据的聚合器、存档器和组织者。举个例子,IPUMS USA 充当美国人口普查微观数据的数据存储库,其数据可以追溯到 1790 年,一直追溯到现在。
331. ND增益
ND-GAIN国家指数是由圣母大学全球适应倡议组织发起的一项倡议,衡量一个国家对气候变化和其他全球化力量的抵御能力。该指数包括食品、健康、基础设施和生态系统等领域的脆弱性分数以及多达 500,000 个数据点的准备情况分数。该信息以 CSV 文件形式包含 1995 年至 2014 年二十年的数据,可供下载。
332. 英国警察
在这个网站上,记者和出版商可以访问有关英国治安和犯罪状况的开放数据。这些数据包含有关社区团队、个别警察部队、拦截和搜查数量的有用统计数据,以及有关犯罪和结果的统计数据。使用这个网站,记者可以对警察部队进行比较,并发现刑事司法的趋势。获取信息非常简单,只需选择日期范围、选择警察部队,然后等待文件即可。
333. Paul Hensel 的通用国际数据页
Paul Hensel 的通用国际数据页面是一系列链接,这些链接按国家和国际体系、国际地理数据、国家能力、社会科学数据收集以及联盟、条约和组织的标题分组。此网页上列出的每个资源都包含最先进的数据,这些数据将自动赋予记者工作的可信度。这些来源可以包括从软件到数据集和档案的任何内容,但此处包含的每个链接都是有用的。
334. 特拉克
在 911 事件后的世界中,恐怖主义及其对当地居民造成的破坏性影响引起了媒体的广泛关注。 TRAC(位于trackingerrors.org)为研究人员提供了有关这些主题的广泛分析和信息。该网站包含有关数千个不同恐怖组织的信息。 500 美元的单用户价格可能有点贵,但对于那些撰写有关暴力和反恐战争的文章的人来说,这个价格是非常值得的。
335. 德克萨斯州刑事司法部
对德克萨斯州刑事司法系统的内部运作感兴趣吗?想知道目前谁在死囚牢房吗?德克萨斯州刑事司法部拥有大量信息,包括囚犯处决前的最后陈述、按性别和种族划分的死囚统计数据,以及进一步的处决统计数据和概况介绍。德克萨斯州刑事司法部是记者最可靠的来源。
336. 综合民间社会组织系统
综合民间社会组织系统(iCSO)旨在使民间社会组织更容易与经济和社会事务部沟通。除了强大框架的有效性之外,该网页还包含数据集和类别以获取更多信息。数据可以按部门、组织类型、涉及的区域以及组织的经社理事会地位进行排序。这是记者绝对可以用来寻找消息来源的数据源。
337. 全球大学
Universities Worldwide 是全球大学的数据库,可以搜索以获取更多信息。搜索可以通过世界列表进行,也可以专门过滤到美国大学,用户也可以在此过程中添加自己的链接。拥有大量学生的数据发布者,甚至是想要核实事实的记者,都可以从能够按需访问这样的数据库中受益。
338. 乌普萨拉冲突数据计划
这是乌普萨拉冲突数据计划的网站,该计划是最著名的有组织暴力信息提供者之一。在该项目过去 40 年的发展过程中,它还凭借收集内战数据的工作确立了自己的地位。记者可以使用此数据源搜索有关特定冲突和这些冲突中的参与者的信息,也可以访问此数据以进行下载。
339. 世界流行音乐
WorldPop 项目是 AsiaPop、AfriPop 和 AmeriPop 项目合并的最终结果,致力于空间人口数据集的归档,而这些数据集又可作为为救灾工作提供支持的一种手段。参与社会正义事业或以其他方式研究有效救灾机会的内容出版商和记者一定会对这个项目感兴趣。研究人员可以下载数据或在线查看案例研究。
340. 草案快递
DraftExpress 在互联网上最著名的可能是它的研究、选秀前的球探报告、模拟选秀权,以及根据历史数据对球员身高和测量数据进行细致的维护。该网站上提到的新秀来自 NCAA、高中,甚至国际联盟。想要提供篮球相关评论的体育记者或内容提供商可以在讨论体育运动中发生的球员和事件时转向 DraftExpress 统计数据。
341. 必发
Betfair 或许是最出名的体育博彩网站。然而,内容提供商和数字出版商特别感兴趣的是关于网站定价数据和历史的详细历史信息的可用性。可以访问和下载带有或不带详细时间戳的数据,同时还提供 2004 年 6 月至 2017 年 10 月期间有关赛马和该网站其他市场产品的大量数据。
342. 评论表
Cricsheet 提供与许多其他体育数据中心类似的服务,但它是一个专门提供板球数据的网站。该网站提供了多个联赛的统计数据和逐球数据,包括印度超级联赛、一日国际比赛,以及男子和女子球队的数据(仅举几个较大类别的数据)。搜索历史板球数据的内容发布者可以下载 CSV 或 XML 格式的数据。
343. 跨国时间序列数据
跨国时间序列数据档案馆拥有涵盖全球 200 多个国家 200 多年的政治、经济、立法和国内冲突数据,是互联网上最全面的数据集之一。最方便的是,数据存储在 Google 云端硬盘表中,单击文件类别后会自动打开该表。作为引用的交换,这些信息可以根据研究人员的需要部分或全部查看。
344. 福特GoBike
Ford GoBike 是湾区使用的自行车共享计划的名称。虽然许多人无疑使用这个程序来保持健康并避免使用化石燃料,但自行车共享系统一直在跟踪行程数据。当然,这些信息不包括任何可以识别骑手身份的信息,但数据中包含自行车号码、开始时间、结束时间、骑手类型以及到达和出发站等详细信息。这值得探索。
345. 海上交通
Marine Traffic 是一家利用大数据追踪和记录船舶移动和海上旅行的公司。 Marine Traffic 的 AIS API 服务涵盖的信息类型包括船舶、航程信息以及有关船舶的数据,例如预期到达、甚至事件、照片、船舶详细信息和航次预测。然而,该网站有定价计划,因此尚不清楚可以免费进行多少研究。
346. 碧溪
Bixi 自行车共享项目可能是北美一些最大城市中最著名的自行车共享项目之一。有趣的是,该品牌还发布了开放数据,提供有关旅行历史和车站状态等信息,以及可以在会员和临时用户之间进行比较。当地记者正在研究人们如何使用自行车共享项目并将其融入他们的生活,他们有充分的理由深入研究这些数据。
347. 事故数据库
从阿米莉亚·埃尔哈特到印尼亚航8501航班,飞行和飞机事故都是人们关注的话题。事故数据库归档和存储1920年至2017年间发生的航空事故数据。该数据库统计的事故包括民用和军用飞艇事故、涉及名人或名人死亡的事故、造成10人或以上死亡的直升机事故、定期和不定期客运航空航班均以死亡告终。
348. 伦敦交通
伦敦交通局是负责监督大伦敦地区公共交通的政府机构。网站上提供地铁和铁路地图以及旅行计划指南。除了所有这些实用服务外,该网站还提供大量开放数据,包括骑行、空气质量、浴缸,甚至牡蛎。任何有兴趣了解大伦敦居民如何使用公共交通的人都可以从访问这些数据中受益。
349. CMAP
CMAP 负责伊利诺伊州杜佩奇县、莱克县、麦克亨利县、肯德尔县、凯恩县、库克县和威尔县的区域规划和组织工作。从网站上可以看出,CMAP的职责延伸到解决社区发展、税收和经济指标,甚至道路和交通等问题。这就是为什么有关区域指标和旅行等领域的开放数据对于试图了解该地区未来全局的记者非常有用。
350. 运费分析框架
货运分析框架是美国运输统计局和联邦公路管理局合作推出的,它收集数据,然后用于评估货运系统的总体健康状况和性能。该软件收集与出发站和到达站相比的商品类型和吨位等详细信息,并且这些数据反过来可供公众访问和下载完整或摘要形式。
351. Mozilla 科学
Mozilla Science 是一款开源、开放实践、协作的软件,可帮助开发和分发不同的数据源和研究成果。抛开透明度利益不谈,开放项目和众包改进流程的决定使得改进现有项目变得更容易。项目涉及生命科学和医学等多个领域,这里的软件解决方案可能代表了该领域具有新闻价值的进展。
352. 很酷的数据集
从该网站的名称就可以明显看出 Cool Datasets 的吸引力。在此页面上,数据集分为政府、娱乐、科学、用户提交、杂项和机器学习等六个一般类别。想要探索数据并挖掘故事的记者可以通过查看该网站提供的内容获得最大收益。可以选择探索数据集,如果可能的话,也可以贡献数据集。
353. 开放数据监控
OpenDataMonitor 是一个平台,它获取公共数据集并以更直观、更易于个人理解的方式呈现它们。研究人员可以访问该平台查看开放数据资源功能的摘要,并且他们将能够看到以更具视觉吸引力的方式呈现给他们的现有数据。该网站解释了其方法和基准,出版商应该可以毫无问题地找到值得出版的数据。
354. 紧缩基地
CrunchBase 最为人所知的也许是它对统计的重视以及它致力于让读者获得最佳可用数据的承诺。有商业头脑的人士每天都会访问该网站,了解投资和行业的最新趋势。在这里,记者和出版商将找到有关最新商业趋势的新闻和新鲜讨论。同时,作为付费选项的一部分,该网站还拥有大量数据集,可以使用 Crunchbase 的软件工具进行分析。
355. 指数
Index 是一个具有独特销售主张的平台,因为它可以为初创公司、投资者、分析师和公司等所有人提供服务。该网站还托管超过 100,000 家科技行业公司的信息,同时为用户提供排序、构建和导出电子表格的功能。出版商和记者浏览头条新闻以寻找潜在的故事角度,可以通过此网站领先于商业新闻。索引可能不寻常,但毫无疑问它是一种有用的资源。
356. 塞姆鲁什
SEMrush 以其成为在线营销人员可用的最完善的搜索智能工具之一而自豪。在学院和网络研讨会之间,研究人员有一切机会学习基础知识。然而,博客和新闻部分包含足够的信息,出版商和记者可以轻松掌握在线广告和搜索引擎优化的所有最新新闻。 SEMrush 的服务确实是有代价的,但他们免费提供大量优质信息。
357. 阿雷夫斯
Ahrefs 或许最适合概括为一套营销工具,对任何在线发布内容的人都可能有用。该网站提供内容研究、网络监控、关键词研究和反向链接研究等服务组合,帮助用户逆向分析竞争对手的成功。从总体上看,Ahrefs 博客可能对在线出版商最有用,对于那些喜欢基于数据进行营销的人来说,它本身就代表了巨大的价值。
358. 天使名单
AngelList 的名字选得很巧妙,它基本上是由 Craigslist 和 LinkedIn 两部分组成,其重点是将投资者、求职者和初创公司聚集到一处。除了这个有趣的网站概念之外,有进取心的记者还有很多机会在最热门的初创企业和最新的投资趋势成为主流之前发现它们。凭借其简单的界面和强大的商业导向,该网站在多种方面对专业人士有用。
359. 获得的
在几乎所有行业中,企业收购几乎可以在一夜之间改变整个行业。 Acquired 是一个网站,其任务是让公众了解技术领域的收购情况。网站上可以查看大量统计数据,并具有过滤搜索的能力,撰写技术文章的记者可以通过将 Acquired 作为日常网络浏览的常规部分来获得最大收益。
360. 马特马克
Mattermark 是一项付费服务,通过生成考虑公司及其关键员工的优质客户名单,让公司决策者的生活变得更轻松。 Mattermark 竭尽全力提供全面的公司简介、API 的灵活性,甚至是用于更新的导出功能。想要更好地定位其外展活动,同时跟踪其活动结果的企业将从注册此项目中获益匪浅。
361. 金融科技初创公司
FintechStartupsCo 作为一种聚合器,跟踪不同公司在 IPO 中筹集的资金金额。采用极简设计,可在“初创公司”和“新闻”选项卡之间切换,这是记者掌握突发筹款新闻的一种快速而简单的方法。与此同时,寻找快速内容和快速故事的出版商也可以从重新审视该网站所提供的内容中获益。
362. 数据狐
以防万一,DataFox 这个名字没有透露出全部信息,DataFox 是一家致力于为其业务客户提供所需信息的公司,以最大化他们的 CRM 并通常做出数据驱动的决策。该公司提供的服务包括会议和公司情报、API 和公司信号,实际上是为正在改进销售和外展工作的企业提供的一站式服务。数字出版商和内容提供商可能也想看看。
363. 公开发送
OpenSpending 是一个免费平台,几乎可以在世界任何地方访问,允许用户搜索和检查公共领域的财务数据。对于社会上的非黑客成员来说,这是一个强大的可视化和分析工具。尤其是记者,可以使用 OpenSpending 找到有趣的新见解,并按照该公司直接在其网站上建议的方式追求故事角度。作为额外的好处,记者是论坛特别要求的职业之一。
364. ESPN 体育 API
ESPN 并不满足于仅仅成为最受欢迎的有线体育频道,它正在将其影响力扩展到编码和 API 领域。在开发者中心,该网站为出版商提供了多种 API 供他们选择,其中包括研究笔记、实力排名、选秀、日历和头条新闻。甚至还有一个 API 可以加载所有主要运动项目的运动员资料、传记和统计数据。准备撰写体育内容报道的记者只能从浏览这些内容中受益。
365. 运动参考
对于喜欢将高级统计数据和资源集中于一处的数据处理体育爱好者来说,Sports Reference 是网络上最好的网站之一。凭借包括球队和球员进攻和防守统计数据的历史数据,体育研究人员可以在这个网站上根据自己的需要进行广泛或狭窄的研究。此外,几乎所有主要运动项目都有数据,从篮球到棒球,还有不同大学运动项目的单独数据。
366. 百万歌曲数据集
恰如其分的“百万歌曲集合”包含了 28 个数据集的元数据和正好一百万首歌曲的音频特征信息。这些信息在很大程度上是哥伦比亚大学 LabROSA 与 Echo Nest 合作的成果,可在 Amazon 的 AWS 系统上访问和托管。用户可以通过 Infochimps 搜索信息,这使得记者和内容发布者可以更轻松地搜索晦涩难懂的琐事。