Il existe de nombreux types de sites différents qui fournissent une multitude de données gratuites, freemium et payantes qui peuvent aider les développeurs d'audience et les journalistes dans leurs efforts de reportage et de narration. L'équipe de State of Digital Publishing tient à les reconnaître, car ils découlent de recherches manuelles. et la reconnaissance de notre public existant.
1. Kagglé
Kaggle est un site qui permet aux utilisateurs de découvrir l'apprentissage automatique tout en écrivant et en partageant du code basé sur le cloud. S'appuyant principalement sur l'enthousiasme de sa communauté importante, le site héberge des concours d'ensembles de données pour des prix en espèces et, par conséquent, il contient d'énormes quantités de données compilées. Que vous recherchiez des données historiques de la Bourse de New York, un aperçu des tendances de la production de bonbons aux États-Unis ou un code de pointe, ce site regorge d'informations.
2. Wikipédia
Il est impossible de rester longtemps sur Internet sans tomber sur un article de Wikipédia. Avec des articles allant de biographies historiques entièrement sourcées et référencées à des chronologies du futur proche et lointain, on peut dire sans risque de se tromper que Wikipédia a consolidé son statut d'encyclopédie gratuite sur le Web. Entre l'entrée qui sert d'aperçu général du sujet et les nombreux livres et références en ligne fournis par le site, Wikipédia est le meilleur ami de l'écrivain à bien des égards.
Comme on peut le supposer d'après le nom du site Web, Common Crawl recherche ou "parcourt" le Web à la recherche de données qu'il stocke et construit ensuite dans un référentiel ouvert auquel les utilisateurs peuvent accéder. Pour deux exemples de ce qui est possible avec ce site, des marqueurs de brevets virtuels et des listes complètes de sites Web proposant des flux RSS fournissent un petit échantillon de la puissance de cette application. Si vous souhaitez effectuer des comparaisons de données ou de sites, il s'agit d'un outil accessible pour créer des informations originales.
4. GDE
EDRM, abréviation de Electronic Discovery Reference Model, est un site pour les professionnels du droit dédié à la réalisation du potentiel de la découverte électronique et des règles et attentes entourant la manière dont les informations sont régies. En outre, les membres de l'EDRM travaillent ensemble pour développer des normes collaboratives, des logiciels et des outils pédagogiques conçus pour faire avancer les objectifs de la communauté. Pour glaner des informations sur la manière dont la technologie peut changer et a changé les aspects procéduraux et administratifs de la pratique juridique, c'est le site que vous souhaitez visiter.
5. Cornac
Mahout se concentre sur un logiciel du même nom qui tente de comprendre la logistique de la construction d'un environnement capable de créer des applications d'apprentissage automatique hautes performances qui peuvent être mises à l'échelle et créées rapidement. Pour les chercheurs qui souhaitent compiler et manipuler leurs propres ensembles de données ou s'essayer aux applications d'apprentissage automatique, ce logiciel est particulièrement utile. Ce site permettra aux individus de bien maîtriser ce logiciel.
Le projet Lemur est une base de données qui se concentre sur le soutien à la recherche sur la récupération d'informations et la gestion des technologies du langage humain. Avec des pages Web comptant environ 1 milliard et 10 langues collectées de janvier 2009 à février 2009, la quantité de matériel présent et de soutien en fait une excellente ressource pour les chercheurs. Entre tout cela et le support supplémentaire qui peut être trouvé sur le site, quiconque s'intéresse à la technologie et aux langages humains aura de quoi travailler sur ce site.
Project Gutenberg est un répertoire qui contient des romans, des articles et d'autres œuvres du domaine public. La collection de plus de 54 000 livres électroniques du site va de documents bien connus tels que Shakespeare, Mark Twain et Jane Austen à des œuvres moins connues de noms plus obscurs comme Henri Bergson et Samuel Butler. Qu'il s'agisse de saisir un roman classique pour être bien lu ou de faire des recherches sur la façon dont les gens ont vécu la vie au 19e siècle, le projet Gutenberg est une excellente ressource.
8. Ensemble de données d'un million de chansons
Il s'agit d'un site Web qui héberge un ensemble de données complet contenant les caractéristiques audio et les métadonnées d'environ 1 million de chansons populaires. En plus de l'ensemble de données principal d'un million de chansons, il existe également un certain nombre d'ensembles de données auxquels la communauté a contribué dans des catégories connexes telles que les reprises, les étiquettes de genre et les paroles, entre autres. Les historiens de la musique, les amateurs ou les chercheurs qui veulent ces informations pourront trier les données avec une relative facilité. Cela pourrait très bien être l'ensemble de données le plus complet sur ce sujet sur l'ensemble d'Internet.
9. Amazone
Tout le monde connaît Amazon en tant que détaillant numérique, mais saviez-vous qu'Amazon héberge également des ensembles de données publics gratuits accessibles à tous sans avoir à stocker ou télécharger quoi que ce soit sur leurs propres appareils ? Avec des données allant de la météo, de l'environnement spatial et des informations météorologiques à l'imagerie axée sur le développement d'algorithmes qui facilitent la vision par ordinateur, les options ne manquent pas pour ceux qui recherchent un moyen plus pratique d'analyser d'énormes quantités de données.
10. Gouvernement ouvert Canada
Dans le but de promouvoir une plus grande transparence, d'inciter davantage de citoyens à s'engager et d'encourager le dialogue, le gouvernement du Canada offre des données détaillées dans le cadre de son initiative pour un gouvernement ouvert. Sur ce site, vous pouvez trouver des ensembles de données sur des questions liées au gouvernement telles que les niveaux de capacité des refuges pour sans-abri au Canada ainsi que des chiffres régionaux sur les niveaux de participation des anglophones et des francophones dans le secteur public. Avec l'accès à des ensembles de données de cette nature, il n'est pas nécessaire de dépendre des statistiques d'autres personnes pour trouver des informations.
Data Catalogs, maintenant Data Portals, offre aux utilisateurs un site pratique pour parcourir les portails de données ouvertes du monde entier. Les portails étant évalués et organisés par différents niveaux de gouvernement, un certain nombre d'ONG et même la Banque mondiale, les données disponibles pour l'analyse sont de très haute qualité. Les utilisateurs ont la possibilité de parcourir ou de contribuer à des portails de données. Du point de vue de la recherche, la variété des sujets et des informations fait de ce site un endroit particulièrement pratique pour commencer une recherche d'informations.
Data.gov.uk est un site qui permet aux particuliers de trouver et d'accéder aux données publiées par divers organismes publics, services gouvernementaux, autorités locales et agences gouvernementales. Ici, les chercheurs peuvent trouver des informations sur le climat économique pour les petites entreprises, le commerce, les importations, l'industrie et les exportations ou même faire des recherches sur les paiements de plus de 25 000 £ effectués par les ministères. Le site indiquant explicitement que les données peuvent être utilisées pour la recherche, les informations couvertes ici peuvent même générer plus d'idées au fur et à mesure que les chercheurs les parcourent.
Ce site est l'endroit où le gouvernement américain fournit des données ouvertes auxquelles le public peut avoir accès sous la forme d'ensembles de données. En plus des données brutes, le site propose également un certain nombre d'outils qui peuvent être utilisés pour effectuer des visualisations de données ainsi que pour créer des applications pour le Web et le mobile. Ne fais pas d'erreur. Les données sont immenses avec des informations allant des plaintes de carte de crédit aux données du programme fédéral de prêts aux étudiants dans plus de 197 000 ensembles de données. Ce site offre de nombreuses possibilités d'innovation et d'analyse complète.
DataSF propose des centaines d'ensembles de données concernant à la fois la ville et le comté de San Francisco. Intéressé de voir ce que les lobbyistes locaux et régionaux ont fait pression ? Avez-vous besoin de statistiques sur la criminalité? Parcourez l'onglet Showcase pour voir ce que les gens ont accompli avec les données ou utilisez le formulaire pour apporter une contribution. Fabriqué avec Open Data et offrant une académie, un blog et un certain nombre d'autres outils, ce site est en grande partie motivé par la collaboration et la communauté. Cela en fait un atout pour le chercheur.
15. DataFerrett
DataFerrett est différent de nombreux sites en ce sens qu'il ne s'agit pas tant d'un référentiel ou d'un répertoire que d'un outil permettant aux utilisateurs de personnaliser les données provenant de sources locales, étatiques et fédérales grâce à l'analyse et à l'extraction de données. Cet outil permet aux utilisateurs de créer des feuilles de calcul personnalisées et complètes, puis de transformer les mêmes informations en une carte ou un graphique sans avoir à télécharger ou activer un autre logiciel. Organiser des entrées de données massives et les transformer en quelque chose de facile à lire n'a jamais été aussi simple.
16. Informations
Par l'intermédiaire de l'Université du Maryland, Inforum met les données économiques américaines à la disposition du public. De nombreuses agences gouvernementales américaines ont contribué à ce site au point où le site contient désormais des milliers de "séries chronologiques économiques", comme il les appelle, et celles-ci contiennent des chiffres sur la production industrielle, les indices de prix, les statistiques du travail et les indicateurs commerciaux. Les données sont disponibles gratuitement et peuvent être consultées avec un ordinateur portable ou un ordinateur de bureau personnel. Les chercheurs qui souhaitent obtenir un bon aperçu des données économiques brutes ont une ressource dans Inforum.
17. Europeana
Selon les propres chiffres du site, les collections d'Europeana représentent un total de plus de 50 millions d'enregistrements. En utilisant les ensembles de données organisés ici, les chercheurs peuvent trouver les informations qu'ils recherchent en moins de temps. Les ensembles de données ici incluent des catégories telles que des modèles 3D, des cartes italiennes de la Première Guerre mondiale et même une collection de plus de 20 000 photos historiques de musées lituaniens, entre autres. Que ce soit pour des recherches historiques générales ou comme point de départ pour parcourir les archives massives d'Europeana, c'est une excellente ressource à avoir.
En plus de sa couverture ininterrompue des dernières nouvelles et événements, le Guardian a également une section entière consacrée aux présentations de données. Les pièces ici vont de sujets sérieux comme l'efficacité des politiques de logement sur le sans-abrisme à des sujets un peu plus légers comme les pays qui ont le plus de lauréats du prix Nobel. Les journalistes et les chercheurs ne manquent pas d'informations à utiliser dans leurs propres projets à partir de ce site. Avec l'aide d'une recherche rapide, il est possible de trouver des données sur à peu près n'importe quoi.
19. Omnibus d'expression génique
Hébergé par le National Center for Biotechnology Information, Gene Expression Omnibus est un site qui contient des « données génomiques fonctionnelles publiques » conformes aux normes MIAME (Informations minimales sur une expérience sur microréseau). Le site accepte également des données organisées ou séquencées tout en fournissant les outils nécessaires pour trouver et télécharger les informations. Ceux qui s'intéressent à l'étude des génomes ou à l'acquisition d'informations sur le sujet auront toutes les données dont ils ont besoin ici et plus encore.
Reconnu depuis longtemps pour ses contributions à l'innovation et au progrès dans les domaines des sciences sociales, le Center for Spatial Data Science (CSDS) de l'Université de Chicago explore la prochaine frontière avec son incursion dans l'analyse spatiale et la technologie. Le travail du CSDS a des applications dans pratiquement tous les domaines qui doivent faire face à l'espace dans l'approche des problèmes. Par conséquent, des domaines comme l'économie environnementale, la santé publique et la criminologie ont tous bénéficié de ces applications. Le dévouement du CSDS aux logiciels open source et la diffusion de ses informations rendent les données fournies encore plus accessibles.
21. Konect
Grâce à l'utilisation des données collectées par l'Institut des sciences et technologies du Web de l'Université de Coblence-Landau, KONECT (Koblenz Network Collection) propose des recherches effectuées dans le domaine de la science des réseaux et de ses sujets connexes. Le projet utilise une série de ses propres outils logiciels d'analyse de réseau pour traiter les chiffres et produire des tracés et des algorithmes dessinés. KONECT héberge alors les résultats de ses travaux d'analyse directement sur le site. Avec plus de 200 ensembles de données parmi lesquels choisir, il s'agit d'une ressource qui mérite d'être explorée.
MIdata est un site qui sert de référentiel pour les données censées être utilisées par les données d'apprentissage automatique. Ces ensembles de données peuvent aller d'une compilation d'expressions faciales humaines à des sujets plus scientifiques comme la prédiction de la façon dont les molécules se lieront. Avec des entrées divisées en catégories qui offrent un accès aux données brutes, des tutoriels dans la section matériel et méthodes, ainsi que des tâches et des défis d'apprentissage, ce site permet aux chercheurs d'analyser le référentiel pour les ensembles de données qui les intéressent.
23. NASDAQ
Le NASDAQ est une bourse de renommée mondiale qui est depuis longtemps une excellente ressource pour les journalistes et les chercheurs à la recherche de données sur le monde de la finance et des affaires. Vous y trouverez des informations sur les introductions en bourse, les données historiques sur les prix et les dernières nouvelles financières qui font de ce site une destination en ligne incontournable pour les données financières. NASDAQ Composite propose également des options de données payantes pour ceux qui souhaitent effectuer une analyse plus approfondie. C'est une ressource très respectée et bien établie.
24. NASA
Depuis l’alunissage, tout le monde connaît désormais cette agence gouvernementale et ses incursions dans l’espace. Il est toutefois intéressant pour les journalistes de constater que la NASA constitue également une source de données précieuse grâce à ses archives coordonnées de données scientifiques spatiales. Ici, les chercheurs peuvent trouver des données sur les missions scientifiques spatiales dans des catégories telles que l'astrophysique, les ressources d'images et l'héliophysique, entre autres. De plus, de nombreux livres blancs sont également disponibles sur le site pour accompagner les nouvelles données soumises.
Socrata est un site qui prend les données gouvernementales disponibles et les met dans un format qui permet aux gens d'analyser, de cliquer et de trouver plus facilement les informations qu'ils recherchent. Conçu spécifiquement pour répondre aux besoins des personnes non techniques telles que les spécialistes des politiques publiques, les chercheurs, les entrepreneurs et les citoyens concernés, Socrata utilise le cloud pour compiler des données provenant de diverses sources. Pour les journalistes qui tentent de comprendre l’efficacité des différentes politiques, cette plateforme est utile.
26. Quandl
Quandle est un site qui propose principalement des données économiques et financières formatées en tenant compte des besoins des professionnels de l'investissement. S'appuyant sur plus de 500 sources d'informations provenant d'organisations crédibles telles que le groupe CLS, l'ONU, les banques centrales et Zacks, entre autres, pour agréger ses données, cette source de données est parfaite pour les chercheurs et les journalistes qui souhaitent avoir une vue d'ensemble en un coup d'œil. Grâce au complément Excel du site, accéder directement aux données n'a jamais été aussi simple pour les utilisateurs.
27. L'université de Carnegie Mellon
L'Université Carnegie Mellon jouit d'une réputation bien méritée en tant qu'excellente institution universitaire. Ce que beaucoup de gens ignorent, c'est que le StatLab de Carnegie Mellon est une ressource utile pour les journalistes en quête de données. Cette archive d'ensembles de données comprend des données sur des questions telles que les salaires MLB des joueurs nord-américains en 1986, ainsi que des données conçues pour être utilisées pour évaluer l'exactitude des logiciels de statistiques. En échange d’une reconnaissance, ces ensembles de données sont disponibles pour un usage public.
28. OPC
Le référentiel d'apprentissage automatique UC Irvine, appelé UCI, est un site qui stocke une tonne de données intéressantes que les journalistes peuvent utiliser. Abritant 394 ensembles de données au moment d'écrire ces lignes, le site présente l'avantage supplémentaire d'avoir une interface facile à rechercher. Certains des ensembles de données les plus populaires incluent des informations sur la « reconnaissance de l'activité humaine à l'aide de smartphones », le vin et le marketing bancaire, entre autres sujets. En échange de l'utilisation de toutes ces données, le site demande simplement une citation.
29. DUC
Si vous êtes un journaliste qui étudie le développement de l'apprentissage automatique, la page Classification/Clustering des séries temporelles UCR constituera une excellente lecture. Le site fournit un document d'information utile qui vous fournira toutes les informations générales dont vous avez besoin. Outre un aperçu de ce que contiennent les informations, le site offre également la possibilité de télécharger directement les données. N'oubliez pas d'utiliser le format de citation demandé par le site si vous utilisez ces ensembles de données.
Besoin de statistiques sur la richesse de la population ? Vous voulez connaître la répartition exacte par sexe d’un domaine particulier ? Le recensement américain est un site qui rassemble toutes ces données et bien d’autres encore accessibles au public. Triez les données par année ou par région et vous serez rapidement en mesure de trouver des statistiques dont la plupart des gens ne savaient même pas qu'elles étaient prises en compte telles quelles dans le recensement américain. Ces chiffres étaient disponibles dans Excel et Microsoft Word sous forme d'options rendant les données encore plus accessibles aux journalistes.
31. Wolfram Alpha
Wolfram Alpha est en fait un moteur de calcul qui permet aux utilisateurs de saisir les données qu'ils souhaitent connaître et de recevoir un calcul. Le moteur effectue des données et des analyses statistiques, de la chimie, des dates et des heures, et même des mots et de la linguistique, entre autres. Pour les utilisateurs qui tentent de découvrir de nouvelles façons de gérer les données, cela est particulièrement utile car il est capable de générer de nouveaux calculs en appuyant simplement sur un bouton. Les journalistes, en particulier, ont beaucoup à gagner en utilisant cette ressource comme ressource supplémentaire.
32. Japper
Il s’avère que Yelp est bien plus que de simples restaurants et avis d’utilisateurs sur les entreprises. Ce site d'évaluation axé sur les utilisateurs conserve également un ensemble de données qui permet aux chercheurs d'accéder aux avis, aux données des utilisateurs et aux entreprises à des « fins personnelles, éducatives et académiques ». D'après le décompte de l'entreprise, cela représente 4,7 millions d'avis et 156 000 entreprises dans 12 zones métropolitaines incluses dans l'ensemble de données. Avec ces chiffres, les matériaux et les tendances que les chercheurs pourraient potentiellement découvrir dans ces données pourraient être une agréable surprise.
Vous voulez avoir une liste des pages Facebook supprimées ? Que pensez-vous du fait de pouvoir trier les données économiques américaines par pays ? Data World est un site qui permet aux utilisateurs de partager, d'héberger, de collaborer et de suivre des données. Le site comprend même une section destinée aux journalistes décrivant les raisons pour lesquelles Data World est utile pour les membres de la profession tout en soulignant également les capacités d'hébergement d'un prédicteur FOIA simplifié ainsi que des pages conçues pour aider à l'organisation. Dans l’ensemble, il s’agit d’un solide mélange de données et d’hébergement de données.
34. Le recueil d'informations sur le monde
Géré et exploité par la CIA, le World Factbook vous donne des informations sur les structures sociétales, l'histoire, la situation militaire et économique de 267 pays, ainsi que des cartes, des drapeaux et un ensemble de fuseaux horaires suivant les éléments de la carte du monde. Le site propose un examen approfondi du sujet d'une manière qui va au-delà des bases. En bref, il s'agit d'une source de données qui devrait figurer dans l'arsenal de tout journaliste.
35. HealthData.gov
Géré par le ministère américain de la Santé et des Services sociaux, HealthData.gov offre au public un accès à des « données de santé de grande valeur » dans l'espoir d'attirer l'attention des entrepreneurs, des décideurs politiques et des chercheurs. Dans les domaines du développement de produits et de services au moins, les gens ont pu examiner ces données et obtenir des résultats. Les journalistes qui souhaitent être à la pointe des données sur la santé ou qui examinent une déclaration publiée par un responsable de la santé peuvent utiliser ce site pour trouver des réponses.
36. UNICEF
Il s'agit d'un site qui confère une crédibilité instantanée aux journalistes qui utilisent les informations qu'il propose. Les statistiques couvertes par l'UNICEF incluent celles relatives aux questions de santé et de droits de l'homme telles que l'éducation, la santé maternelle, la pauvreté des enfants, l'eau et l'assainissement et le handicap des enfants, parmi de nombreuses autres catégories de statistiques conservées. Il est utile pour les chercheurs car il est à jour et soutenu par l'une des organisations les plus connues de la planète. Les journalistes ne peuvent pas se tromper en citant cette source de données.
37. Organisation mondiale de la santé
L'Organisation mondiale de la santé est une organisation internationale qui rassemble des statistiques et des informations sur la santé dans le monde entier. Outre les informations accessibles directement sur la page d'accueil, le site propose également des données via l'Observatoire mondial de la santé. Ces données comprennent des informations sur les mesures prises par les pays vers des soins de santé universels, la recherche et le développement en santé, entre autres catégories. Les journalistes trouveront ici de nombreuses informations sur les épidémies, les urgences sanitaires et la couverture des soins de santé dans une perspective internationale.
Avec la disponibilité des données publiques de Google, les journalistes peuvent clairement s'appuyer sur Google à plus d'un titre. Le géant des moteurs de recherche dispose de données publiques disponibles et disponibles pour analyse avec plus de 100 ensembles de données publiques à son actif. Le sujet des données va de l'extrêmement sérieux avec les indicateurs de développement mondial et les indicateurs de développement humain jusqu'à l'intéressant avec les données sur les routes les plus dangereuses d'Europe. Tout ce qu'un chercheur a à faire est de lancer une recherche et de voir ce que contiennent les données publiques de Google.
39. Gap Minder
Gap Minder propose des données sur un certain nombre d'indicateurs locaux et nationaux ainsi que des liens et des informations sur tous les fournisseurs de données. Grâce à ce site, les chercheurs peuvent consulter des informations telles que l'âge des femmes lorsqu'elles se marient pour la première fois, des statistiques sur la consommation d'alcool et les causes de décès des enfants. Pour les journalistes qui écrivent avec une perspective internationale ou qui travaillent sur des données comparatives, il s'agit d'une excellente ressource. Il s’agit quoi qu’il en soit d’une source de données utile.
40. tendances Google
Google Trends est un outil qui donne aux chercheurs un aperçu de ce que les gens recherchent en ce moment. Les chercheurs peuvent comparer les données aux tendances qui se sont produites dans le passé et peuvent également utiliser l'outil pour faire des estimations avant, par exemple la période des fêtes, afin de voir ce qui se passera pour les recherches à l'avenir. Google Trends propose des graphiques, des sujets d'actualité et de nombreuses opportunités de découvrir l'actualité avant qu'elle ne devienne officiellement une actualité.
41. Google Finances
Google Finance offre une opportunité simple et rapide d'effectuer une recherche plus approfondie sur une entreprise dont les investisseurs raffolent. Des moyens simples de filtrer les indicateurs techniques et de consulter les dernières nouvelles de l'entreprise dans une fenêtre simple et directe qui vous permet de trier encore plus les informations. En plus, c'est gratuit. Pour les journalistes qui souhaitent rechercher les finances d'une entreprise cotée, Google Finance propose une interface intuitive pour accéder à ces informations. Malheureusement, Google a récemment abandonné certaines fonctionnalités essentielles telles que le portefeuille financier. Voici quelques alternatives à Google Finance .
42. DBpédia
Quiconque a déjà souhaité un moyen plus simple d'effectuer des recherches sur Wikipédia a des raisons d'être enthousiasmé par DBpedia. Propulsé par l'engagement de la communauté, ce site cherche à permettre d'effectuer des recherches plus sophistiquées sur le contenu de Wikipédia. Avec la version anglaise comptant 4,58 millions d'entrées avec classifications et catégories associées, le site est en passe d'offrir une couverture complète basée sur les informations de Wikipédia. Les journalistes ne peuvent pas se tromper avec cette source de données.
Pour beaucoup, Pew Research se situe à l’échelon supérieur en ce qui concerne les enquêtes, les rapports et les données de recherche. Le site couvre des sujets allant des opinions politiques aux tendances sociales et aux développements dans diverses industries du lieu de travail. Pew Research dispose également d'une fonction de recherche qui facilite plus que jamais l'accès aux informations. Les journalistes qui souhaitent des statistiques et des conclusions à jour provenant d'une source fiable et réputée ne peuvent pas se tromper en se tournant vers Pew Research.
44. Institut élargi
Pour les journalistes qui souhaitent connaître les dernières nouvelles en matière de cancer, les ensembles de données du Broad Institute pourraient être l'endroit idéal pour trouver l'information. Cela comprend également des informations sur des sujets supplémentaires tels que la bioinformatique et la biologie computationnelle ainsi que le cancer du cerveau et la découverte de modèles moléculaires. En bref, ce site donne aux journalistes un avantage en termes de recherche de données approfondies sur le cancer pour créer des articles à partir des données fournies par le Broad Institute.
45. Données UN
UNdata propose des informations sur différents pays du monde. Cela comprend des données telles que des indicateurs techniques, des indicateurs sociaux et des indicateurs économiques pour chaque pays impliqué. Pour les journalistes qui travaillent sur des sujets d’intérêt humain ou des sujets qui pourraient bénéficier d’être étayés par des statistiques et des données supplémentaires, UNdata est le choix idéal. L'exactitude des données ainsi que la réputation de l'ONU en font une source de données sur laquelle les journalistes peuvent compter lorsqu'ils effectuent des recherches.
46. Google Scholar
Imaginez si, au lieu de parcourir des sites Web, il était possible d'effectuer une recherche ne contenant que des articles évalués par des pairs et du matériel académique. Google Scholar permet aux utilisateurs de trouver des articles de revues, des livres blancs et des publications rédigés par les plus grands universitaires du monde. Comme c'est généralement le cas pour cette entreprise, Google Scholar est aussi intuitif que possible, l'utilisateur devant simplement saisir un mot-clé pour lancer le bal. La recherche d'articles universitaires n'a jamais été aussi simple.
47. Reddit
Connu plus communément comme « la première page d’Internet », Reddit est l’un des sites Web les plus populaires sur Internet. En plus d'être un indicateur précis de ce qui se passe en ligne, le site dispose également d'un subreddit, ou sous-forum, également consacré aux ensembles de données. Les utilisateurs peuvent demander des ensembles de données, publier des ressources et discuter de l'utilisation des données via des formats tels que JSON. Les chercheurs ont beaucoup à gagner en parcourant cette source de données.
Qlik DataMarket vous permet de collecter et de gérer des données provenant de sources externes. Cette plateforme permet aux utilisateurs d'emprunter plusieurs ensembles de données avec la possibilité de les croiser avec les données qu'ils possèdent déjà afin d'affiner leur perception d'un contexte plus large. Mieux encore, même s'il s'agit d'une plateforme payante selon le sujet, il existe également une option gratuite avec Qlik Datamarket. Les journalistes qui explorent les données peuvent le faire à leur guise.
49. Hubspot
Hubspot a toujours été un leader d'opinion dans le who's who du marketing pour les entreprises. Du point de vue de la recherche, il s'agit d'un site qui dira aux chercheurs tout ce qui se passe dans l'industrie ainsi que ce dont parlent actuellement les gens de l'industrie du marketing, en temps réel. Les journalistes peuvent utiliser ce site pour en savoir plus sur les tendances. À cet égard, Hubspot est une excellente ressource pour les chercheurs.
50. Bureau des statistiques judiciaires
Sans surprise, le Bureau of Justice tient une tonne de statistiques. Sur le site Web du Bureau, vous pouvez trouver des chiffres sur les arrestations, les décès de détenus, les exécutions par la peine capitale, les statistiques des forces de l'ordre et les recensements des prisons. Le système de justice pénale est un sujet de fascination constante tant pour le public que pour les personnes qui y sont impliquées. C'est ce qui rend les statistiques du Bureau of Justice encore plus utiles pour les journalistes qui effectuent des recherches sur le système de justice pénale.
51. Rapport uniforme sur la criminalité
Le Uniform Crime Report est une collection de statistiques sur les crimes contre les biens et les crimes violents rassemblées par le FBI. Alors que les forces de l'ordre de partout aux États-Unis communiquent ces données depuis 1930, les résultats publiés remontent à 1958. Les journalistes qui souhaitent explorer les données sur la criminalité ont la possibilité d'accéder et d'utiliser l'outil de données DUC pour explorer les informations disponibles sur ce site.
52. Déclaration uniforme de la criminalité
Le Uniform Crime Reporting est le résultat d'un programme imaginé par l'Association internationale des chefs de police en 1929. Les chiffres rassemblés ici par le FBI sont publiés quatre fois par an. En plus des informations fournies par le programme DUC, le site comprend également des rapports sur les statistiques sur les crimes haineux, les agents chargés de l'application de la loi tués et agressés (LEOKA), ainsi que les résultats et les chiffres fournis par le Système national de déclaration basé sur les incidents.
53. NACJD
NACJD, ou National Archive of Criminal Justice Data, est un site qui extrait des informations d'ensembles de données tels que les rapports uniformes de criminalité (UCR) et la National Crime Victimization Survey (NCVS), puis stocke et distribue les statistiques. Conçues pour être organisées, stockées et conservées pour une accessibilité ultime, les données se présentent sous plusieurs formes, notamment expérimentales, qualitatives et longitudinales. En fin de compte, cela offre aux journalistes et autres chercheurs un autre moyen de visualiser et d’accéder aux statistiques de la justice pénale.
54. Première banque de données
First Databank est un site qui traite des données sur les médicaments. Le site vise à promouvoir une prise de décision plus efficace et davantage fondée sur les données dans le domaine pharmaceutique. Cela permet aux médecins et aux cliniciens de commencer à réfléchir différemment aux médicaments pharmaceutiques grâce à l'utilisation innovante de la technologie de First Databank. D'un point de vue professionnel, ce site est particulièrement utile car ses données peuvent aider les équipes à s'adapter à l'arrivée de nouvelles informations. Il s’agit à tout le moins d’une ressource utile pour les journalistes écrivant dans le domaine pharmaceutique.
55. FDA
La FDA, connue sous le nom de Food and Drug Administration, est l'agence chargée de protéger la santé publique par la supervision et l'approbation des médicaments, des produits alimentaires, des suppléments, des vaccins et des cosmétiques, entre autres produits de consommation. En tant que ressource, la FDA met à la disposition du public des ensembles de données, tout en fournissant également des données techniques aux personnes habituées à travailler avec des feuilles de calcul et à analyser les informations provenant des ensembles de données. C'est certainement une ressource utile pour les journalistes.
Vous êtes-vous déjà demandé combien exactement le pays paie à la suite d’une épidémie de drogue ? Y a-t-il des rumeurs selon lesquelles les gens consommeraient des drogues différemment qu’avant ? Drugbase propose une base de données regorgeant de statistiques sur les tendances et la consommation de drogues aux États-Unis. Il existe des infographies ainsi que des publications sur des sujets tels que la comorbidité de la toxicomanie et de la maladie mentale ou des faits sur la conduite sous drogue (et non en état d'ébriété). Il s'agit d'une ressource qui fournit suffisamment d'informations pour repérer les tendances et faire des comparaisons avec les données passées.
57. ONUDC
L'ONUDC, ou Office des Nations Unies contre la drogue et le crime, dispose d'un site Web consacré à la poursuite de son objectif consistant à aider les États membres à adopter des normes plus strictes en matière de recherche, de collecte de données et de médecine légale. Sur ce site, les chercheurs peuvent trouver de nombreuses statistiques et publications qui couvrent des sujets tels que la collecte de données, l'analyse des tendances et les programmes de recherche lorsque cela est possible. Une ressource qui regorge d'informations sur une variété de sujets liés à la médecine légale ainsi que sur la science du sujet.
58. Faits sur la guerre contre la drogue
Drug War Facts est un site qui propose des discussions approfondies sur la guerre contre la drogue ainsi que sur les conséquences de cette politique. Cela comprend des statistiques et des chiffres sur des détails tels que des comparaisons entre le coût du traitement et le coût du recours aux forces de l'ordre, des chiffres sur les estimations des dépenses en matière de contrôle des drogues et une multitude d'informations sur à peu près tous les sujets liés à la guerre contre la drogue. Pour de nombreuses personnes, il s’agit du site le plus complet du Web en matière de guerre contre la drogue.
59. Centre national des statistiques de l'éducation
Le Centre national des statistiques de l'éducation, souvent appelé NCES, est l'endroit idéal pour obtenir toutes les statistiques liées à l'éducation. Ce site contient des statistiques sur l'état des prêts étudiants, des projections des tendances en matière d'éducation, ainsi que des ensembles de données et des outils de comparaison qui peuvent être utilisés pour effectuer une analyse plus approfondie. Les journalistes peuvent utiliser cette ressource pour découvrir des tendances, vérifier les déclarations publiques, consulter les publications du Centre national des statistiques de l'éducation et trouver de nouvelles histoires dans les données.
60. Banque mondiale
La Banque mondiale héberge de nombreuses statistiques et données compilées par le Development Data Group dans le secteur financier ainsi que dans le domaine macro-économique. Il est possible de trier les données en utilisant des hashtags. Les utilisateurs peuvent choisir entre une variété d’indicateurs et effectuer une sélection par pays afin d’examiner les différentes mesures du progrès en matière de développement. En tant que tel, il s’agit d’une ressource à laquelle toute personne examinant la situation financière et/ou économique des pays membres peut bénéficier de l’accès.
61. Bureau des statistiques du travail
Le Bureau of Labor Statistics est la source incontournable des journalistes pour obtenir des chiffres et des statistiques concernant les conditions de travail actuelles, ce qui se passe sur le marché du travail, ainsi que la façon dont les prix changent et affectent l'économie américaine. Les travaux statistiques de l'agence remontant à 1884, les données économiques ne manquent pas pour les chercheurs. Le site stocke les informations dans une interface conviviale et met constamment à jour les données disponibles pour la recherche. Il s’agit d’une source de données qui mérite d’être explorée.
62. Les nombres
Les sorties à succès attirent beaucoup l'attention des médias, mais il est difficile de dire dans quelle mesure une entreprise s'en sort réellement sans chiffres. Entrez « Les chiffres ». Ce site Web propose des recherches et des données sur l'industrie du cinéma et du divertissement. Les chercheurs peuvent explorer les estimations de revenus, les attentes concernant les versions à venir et d'autres données d'investissement via la capacité du moteur de recherche basé sur SQL d'OpusData. The Numbers est le premier endroit où les chercheurs se rendent pour obtenir des statistiques fiables sur les films et les films. C'est ce qui en fait une excellente ressource.
Film Forever est un site que les chercheurs peuvent visiter pour obtenir des informations sur le marché et des données sur l'industrie cinématographique au Royaume-Uni. Ici, les utilisateurs peuvent trouver les numéros hebdomadaires du box-office pour les 15 meilleures sorties au Royaume-Uni, des recherches d'audience, des rapports, des études de cas et l'annuaire statistique phare de l'organisation. De plus, le site dispose également d'un calendrier qui tient les téléspectateurs informés de la date de publication des prochaines statistiques. La niche de Film Forever en fait une source de données particulièrement intéressante.
64. IFPI
L'IFPI est un site qui se targue de prendre le pouls de l'industrie mondiale du disque. Les utilisateurs trouveront des rapports publiés contenant des informations sur la musique enregistrée, des données de ventes nationales et mondiales, ainsi que des rapports sur le côté commercial de l'industrie musicale qui montrent comment les entreprises investissent dans la musique. Ces rapports permettent aux utilisateurs de voir ce qui se passe. Ce site tiendra les chercheurs informés en temps réel de ce qui se passe dans l'industrie musicale.
65. Statiste
Statista est un moteur de recherche comme Google, mais au lieu de pages Web, le site renvoie des données et des statistiques. D'une simple pression sur un bouton, les utilisateurs peuvent accéder immédiatement à plus d'un million de statistiques et de faits. Les utilisateurs trouveront des infographies, des statistiques sur la Chine, l'industrie alimentaire, les marchés de consommation et, moyennant des frais, des dossiers et des rapports industriels pourront également être consultés. Que vous recherchiez des informations sur l'économie, les réseaux sociaux ou le Big Mac, c'est l'endroit idéal pour le faire.
66. EPA
L'EPA, qui est l'abréviation de l'Environmental Protection Agency des États-Unis, est l'agence gouvernementale chargée de protéger les personnes et l'environnement en appliquant les lois établies et adoptées par le Congrès. Sur le site Web de l'EPA, les utilisateurs peuvent consulter un certain nombre d'ensembles de données sur des sujets allant de l'agriculture à des sujets aussi précis que les rejets annuels de produits chimiques toxiques et les méthodes de gestion des déchets. Ce site est un excellent choix pour les journalistes qui souhaitent accéder à des données environnementales brutes.
67. Centres de contrôle et de prévention des maladies
Ce site Web des Centers for Disease Control and Prevention se présente comme un « guichet unique pour les données environnementales sur la santé publique ». Sur ce site, les chercheurs trouveront des références et des listes de systèmes de données qui reçoivent des fonds nationaux tout en suivant et en stockant des informations liées aux préoccupations de santé publique environnementale. En mettant l'accent sur les programmes qui fonctionnent au niveau national et l'accessibilité grâce à des capacités de téléchargement direct, il s'agit d'une ressource sur laquelle on peut compter pour obtenir les informations les plus récentes et les plus précises sur le Web.
68. Centres nationaux pour la santé environnementale
Créés après la fusion de trois agences auparavant indépendantes, les Centres nationaux pour la santé environnementale sont l'endroit idéal pour obtenir des informations de haute qualité sur l'environnement. Offrant des données complètes allant des données océaniques aux enregistrements de glace d'il y a des millions d'années, si le problème concerne l'environnement, il y a de fortes chances que ce site Web contienne des informations à ce sujet. L'engagement de l'agence envers l'exactitude et l'excellence dans sa gestion de l'une des plus grandes archives de ce type en fait également l'un des rares sites en ligne à posséder, mettre à jour et conserver ce type de données.
69. Service météorologique national
Le service météorologique national de la National Oceanic and Atmospheric Administration dira aux chercheurs tout ce qu'ils doivent savoir sur la météo. Ce site propose des recherches de données qui incluent des informations sur des catégories telles que les avertissements et prévisions, le climat, les prévisions géographiques et plus encore. De plus, il est accompagné d'une carte intuitive et facile à suivre avec des onglets sur lesquels on peut cliquer pour obtenir différents résultats. Qu'il s'agisse d'examiner ce qui s'est passé localement ou de trouver les prévisions pour une ville dans un état différent, ce site découvrira rapidement des informations.
70. Wunderground
Wunderground est une ressource dédiée à garantir que les informations météorologiques soient accessibles à tous dans le monde, en accordant également une attention particulière aux zones qui ne reçoivent pas beaucoup de couverture. Wunderground déclare explicitement avoir pris des mesures pour garantir que l'expérience utilisateur est excellente sur plusieurs plateformes numériques. Cela signifie que le site est accessible aussi bien sur mobile que sur PC, ce qui en fait une ressource idéale pour les journalistes en déplacement.
71. Base météo
Weatherbase fournit des informations sur les conditions actuelles, les moyennes, les informations climatiques et les conditions de voyage pour plus de 40 000 villes à travers le monde à l'aide d'une simple barre de recherche. Utilisez le site compagnon vers lequel le site renvoie afin de trouver des informations de voyage supplémentaires telles que des convertisseurs de devises, des coordonnées et des informations sur le comté, entre autres faits amusants. Weatherbase peut également être utilisé pour trouver des lieux de vacances uniquement en fonction de la météo. Bonne recherche !
Publié sous l'égide de l'Agence internationale de l'énergie, l'Energy Atlas offre aux chercheurs la possibilité de voir le monde à travers les statistiques énergétiques. Conçu à l'origine pour être une source de données complémentaire dès sa création initiale, le site propose un bilan énergétique animé du flux de Sankey ainsi que plusieurs bases de données pour accompagner les publications qui peuvent être consultées sur la page de statistiques de l'Agence internationale de l'énergie. Les chercheurs trouveront ce site et ses sites complémentaires extrêmement utiles lorsqu'ils étudieront la manière dont les pays et les villes utilisent l'énergie.
73. Bureau d'analyse économique
Le Bureau of Economic Analysis, ou BEA en abrégé, publie un large éventail d'informations utiles qui permettent aux chercheurs de garder le doigt sur le pouls de l'économie nationale. Sur ce site, vous trouverez des chiffres sur les comptes économiques américains qui incluent, entre autres données utiles, des chiffres sur les dépenses de consommation, le PIB et les actifs fixes. Les chercheurs peuvent effectuer une recherche par région ou par secteur ainsi que par niveau grâce aux options de recherche internationales, nationales et régionales. Essayez la page de données interactive pour en savoir plus sur le bureau.
74. Bureau Nationale de la Recherche Economique
Le site Web du Bureau national de recherche économique, ou NBER, est une source de données qui aborde l'économie d'un point de vue analytique. Il héberge des données sur un large éventail de sujets économiques avec des entrées telles que l'indice de la gouvernance africaine, le cycle économique officiel, les indices expérimentaux de coïncidence, d'avancée et de récession et la base de données macro-historique. Le NBER possède des ensembles de données officiels publiés et compilés sous son propre nom ainsi que des index compilés par d'autres éditeurs.
75. Commission américaine des valeurs mobilières et des changes
La Securities and Exchange Commission des États-Unis est une agence qui agit comme une sorte de chien de garde pour promouvoir la transparence, l'équité et l'efficacité des marchés. Il est intéressant de noter que le site dispose d'un ensemble de données d'états financiers allant de janvier 2009 à octobre 2017, avec des mises à jour effectuées chaque trimestre. Les chercheurs peuvent compter sur ce site pour rester au courant des dernières nouvelles en ce qui concerne les dépôts et les informations qu'il peut vous fournir sur les entreprises et l'état de leurs finances.
76. FMI
Le Fonds monétaire international, également connu sous le nom de FMI, est une organisation bien établie dans le secteur économique et financier international. Sur le site Internet, les chercheurs peuvent trouver une multitude de données sur ces sujets. Les utilisateurs peuvent rechercher des ensembles de données par indicateur et par pays et parcourir les graphiques et les cartes tout en effectuant des recherches. Les ensembles de données populaires incluent la direction du commerce, les prix des matières premières, les indicateurs de solidité financière, les enquêtes et les statistiques financières internationales, entre autres éléments d'informations précieux.
Conçu à l'origine par Harvard, l'Atlas est un outil en ligne qui permet aux utilisateurs de visualiser et d'interagir avec la situation commerciale d'une entreprise. Atlas prendra ensuite les informations et proposera différents produits que le pays pourrait potentiellement fabriquer afin d'améliorer son économie. Il s'agit d'un outil utilisé par les décideurs politiques, les hommes d'affaires, les investisseurs et les membres engagés du public qui souhaitent mieux comprendre le climat économique d'un pays donné. Les questions de commerce et d’économies nationales n’ont jamais été aussi accessibles.
Doing Business est le résultat d’un effort visant à procéder à des évaluations objectives des réglementations commerciales. Le site examine près de 200 économies et de nombreuses villes en mesurant des détails tels que des indicateurs économiques et en classant la facilité de faire des affaires. Ce site permet aux utilisateurs d'examiner les effets de divers types de réglementations commerciales entre les pays et héberge des rapports ainsi que des données qualitatives détaillées. De plus, le site permet également de faire des comparaisons dans le temps.
79. Comtrade
Initialement un projet du ministère du Commerce, de l'Énergie et de la Stratégie industrielle du Royaume-Uni en collaboration avec le ministère du Commerce international, Comtrade est une excellente ressource. Empruntant des données aux données Comtrade des Nations Unies, le site fournit aux utilisateurs un graphique interactif qui peut être utilisé pour rechercher, comparer et analyser les chiffres exacts du commerce et des marchandises entre les pays. Sélectionnez simplement le pays déclarant, choisissez un pays partenaire et effectuez autant de sélections que possible.
80. Données financières mondiales
Global Financial Data est une source qui ne se contente pas de compiler des données financières standard, elle reprend des informations financières datant des années 1200 jusqu'à aujourd'hui. Ces informations proviennent de diverses sources, notamment de livres, de documents archivés, de revues universitaires et de périodiques d'information. De plus, le site dispose d'ensembles de données qui utilisent la méthode statistique de liaison en chaîne. Le résultat final, du point de vue de l'utilisateur, est une ressource qui ne ressemble à aucune autre sur Internet en raison de ses données exclusives.
Visualizing Economics est moins une ressource au sens de découverte de données du terme qu'un service axé sur la conception de graphiques d'informations et de tableaux de bord interactifs. En outre, Visualizing Economics effectue également des analyses et des conceptions dans le but exprès de rendre les données économiques plus faciles à comprendre. Grâce à ce site, les journalistes ont une opportunité légitime de travailler avec un professionnel possédant des années d'expérience dans la traduction de données économiques en quelque chose de plus accessible au grand public.
82. Portail des données ouvertes de l'UE
Le portail des données ouvertes de l'UE est un projet qui a été mis en place à la suite d'une décision prise par la Commission européenne. Sur ce site, les institutions de l'UE proposent des données destinées au public et à leur utilisation sans restrictions de droit d'auteur et disponibles gratuitement. Les ensembles de données comprennent les données de référence CORDIS, le registre de transparence et même une liste complète des personnes, entités et groupes contre lesquels l'UE a imposé des sanctions financières. De plus, les données sont disponibles dans un certain nombre de formats numériques.
83. Réseau de données ouvert
L'Open Data Network est un site qui permet aux utilisateurs de rechercher des données par région et par ville. Dotés d'une page d'accueil claire et intuitive sur le site, les chercheurs ont la possibilité d'effectuer une recherche par catégorie de données, par ville et même par exemples de questions. Sur chaque page, après avoir parcouru les catégories de données ou les exemples de questions, vous trouverez également des liens pratiques vers encore plus d'ensembles de données. L’organisation des données à elle seule fait de l’Open Data Network un site qui mérite d’être exploré.
The Landmatrix est un site qui propose une base de données en ligne sur les transactions foncières dans le but de promouvoir plus de transparence sur les acquisitions. Essentiellement, cet outil peut être utilisé pour visualiser et donner un sens aux différentes transactions foncières. Les données s'améliorent, changent et sont constamment ajustées afin d'améliorer l'exactitude des informations mises à disposition. À ce jour, Landmatrix dispose d’informations sur plus de 1 000 transactions. C'est une source à explorer pour les chercheurs.
85. Programme de développement des Nations Unies
Le Programme des Nations Unies pour le développement héberge de nombreuses données utiles sur le développement humain dans le monde que le public peut explorer. Avec des dates s'étendant généralement de 1990 à 2015 dans un grand nombre de ces ensembles de données, les index comprennent des tableaux complets tels que les tendances de l'indice de développement humain, l'indice d'inégalité entre les sexes et l'écart entre les sexes au cours de la vie. Les chercheurs peuvent rechercher les données directement via la barre de recherche et également parcourir le pays si l'intention est de parcourir le graphique.
86. OCED
L'OCDE, connue sous le nom d'Organisation de coopération et de développement économiques, dispose d'un site dont l'objectif est d'aider les gouvernements dans leurs initiatives de lutte contre la pauvreté et de prospérité grâce à la stabilité et à la croissance économiques. Sur ce site, les chercheurs trouveront du matériel évalué par des pairs, des publications, ainsi que des normes et des arguments en faveur de l'établissement de normes. L'OCDE héberge également un factbook qui fournit un outil de référence économique solide pour accompagner un certain nombre d'enquêtes et de prévisions sur les perspectives économiques que l'on peut trouver sur ses pages.
87. Département américain de la Santé et des Services sociaux
Le ministère américain de la Santé et des Services sociaux exploite un site qui fournit des informations sur le Conseil présidentiel sur le fitness, les sports et la nutrition. Avec des faits et des données compilés avec l’aide de plusieurs experts dans des domaines connexes tels que des chefs et des athlètes. De plus, le site propose également de nombreuses statistiques. Les chercheurs peuvent trouver des faits sur l’activité physique des enfants, les habitudes de renforcement musculaire des adultes, ainsi que des informations sur les habitudes alimentaires du public, ainsi que sur l’obésité, parmi de nombreux autres faits et statistiques.
88. Partenaires dans l’accès à l’information pour le personnel de santé publique
Partners in Information Access for the Public Health Workforce est un projet né de la collaboration d’organisations de santé publique, d’agences gouvernementales américaines et de bibliothèques spécialisées dans les sciences de la santé. Les pages thématiques de ce site incluent des sujets tels que les subventions et le financement, la promotion de la santé et l'éducation sanitaire, ainsi que la littérature et les lignes directrices. Dans la section Sujets de santé publique, vous trouverez également des données sur des sujets tels que le bioterrorisme, la génomique de la santé publique et la santé publique dentaire, pour n'en nommer que quelques-uns.
89. Fondation Unie pour la Santé
Au cours des trois dernières décennies, la United Health Foundation a fourni des informations sur les classements en matière de santé afin de les utiliser comme moyen de mesurer la santé publique. Le site héberge de nombreux rapports et publications, notamment des rapports sur la santé de ceux qui ont servi, des rapports de haut niveau, la santé des femmes et des enfants, des rapports annuels et même des notes d'information sur des sujets importants dans le domaine. Utilisez la carte interactive pour explorer par région et obtenir plus d'informations. Il existe également une barre de recherche pour une navigation plus approfondie si les chercheurs recherchent quelque chose de plus spécifique.
Aux États-Unis, Medicare est le principal moyen sur lequel comptent de nombreuses personnes pour obtenir une assurance maladie et accéder aux soins médicaux. Outre les services qu'il propose en temps réel, Medicare propose également des données sur les normes et la qualité des traitements dans les établissements et les hôpitaux via son tableau de comparaison et ses règles. Il s'agit de l'ensemble de données officiel utilisé par le site Web Hospital Compare et il regorge de données qui peuvent être téléchargées dans Excel pour une plus grande facilité d'accès.
91. Surveillance, épidémiologie et résultats finaux (SEER)
Surveillance, Epidemiology and End Results, également connu sous le nom de SEER, propose un site particulièrement utile en tant que source d'informations sur les statistiques sur le cancer. Il héberge des résumés statistiques qui permettent de rechercher des chiffres associés au cancer qui peuvent être triés par siège du cancer, origine ethnique, race, âge, sexe et même par type de données. Le site héberge également des publications, des ensembles de données et des logiciels qui peuvent être utilisés par les chercheurs pour une analyse encore plus approfondie.
Amnesty International est une organisation qui défend depuis longtemps les droits de l'homme et la justice dans le monde. Il héberge également de nombreuses données sur la situation des droits de l'homme dans le monde ainsi que des informations sur des atrocités et des crimes contre l'humanité spécifiques à différents moments dans le cadre de son rapport annuel. Les chercheurs peuvent utiliser ces informations pour faire des comparaisons entre différentes années et voir comment différents pays ont évolué ou régressé dans le domaine des droits de l'homme.
93. Groupe d'analyse des données sur les droits de l'homme
Depuis sa création il y a 25 ans, le Groupe d'analyse des données sur les droits de l'homme applique des principes scientifiques aux violations des droits de l'homme dans différents pays du monde. Le site héberge des publications publiées dans des médias réputés tels que le Washington Post et des publications officielles des éditeurs Macmillan, classées par année. Parallèlement aux publications organisées depuis des années, des projets ont également été réalisés dans le monde entier. Pour un aperçu plus technique des violations des droits de l’homme, cette recherche est intéressante.
94. Données sur les relations internationales et les droits de l'homme
Ce site héberge des bases de données compilées par de nombreuses organisations réputées, universités et même agences gouvernementales. Citons par exemple le projet Manifeste, le projet Minorités (à risque), le district des États-providence comparés et la base de données sur les conflits armés. Certains projets comme le projet Polity IV remontent aux années 1800. Parallèlement, des projets comme l’Institut international de recherche sur la paix de Stockholm (SIPRI) mesurent les transferts d’armes, les dépenses militaires internationales et les tendances en matière de sécurité. La meilleure façon d’apprécier les données serait de se rendre sur le site et de l’explorer.
95. Programme de données sur les conflits d'Uppsala
Le Département de recherche sur la paix et les conflits d'Uppsala, souvent appelé UCDP, héberge une énorme base de données appelée UCDP Conflict Encyclopedia. Il s'agit d'un site qui permet aux utilisateurs de cliquer et d'explorer les données que le ministère a déjà désagrégées. Les chercheurs peuvent être cliqués sur le site Web et également téléchargés pour une manipulation et une analyse plus approfondies. Il s’agit d’une ressource sur laquelle on peut compter et référencée pour des informations de qualité distribuées de manière accessible.
96. Département du Travail des États-Unis
Le Département du Travail des États-Unis héberge de nombreuses données économiques concernant les statistiques sur le chômage et l'emploi. Naturellement, ces chiffres incluent des bases de données comprenant des statistiques sur les licenciements massifs, des projections d’emploi, des offres d’emploi et du roulement du personnel, des statistiques nationales sur l’emploi et même des statistiques de comparaison internationale du travail. Le site fournit des informations à jour et exactes tandis que le ministère du Travail assure le suivi de tout cela. Il s’agit d’une ressource réputée bénéficiant du soutien du gouvernement à des fins de recherche.
97. Administration des petites entreprises
La Small Business Administration est depuis longtemps une ressource éprouvée pour les entrepreneurs et autres aspirants entrepreneurs. Ce site héberge une tonne de statistiques sur l'emploi ainsi que des informations permettant aux chercheurs de réaliser des études de marché et des analyses concurrentielles. Ici, les chercheurs peuvent trouver des chiffres, des statistiques et des outils qui peuvent être utilisés pour découvrir des données supplémentaires. Pour obtenir des informations sur les statistiques des petites entreprises du point de vue des employeurs et des entreprises, il s'agit d'une excellente ressource vers laquelle les journalistes peuvent se tourner à tout moment.
98. Crowdpac
Crowdpac est une plateforme qui permet aux candidats politiques de collecter des fonds et de s'organiser. S'inspirant largement de l'idée selon laquelle un certain nombre de candidats au Congrès se présentent à chaque élection sans opposition, ce site permet aux citoyens engagés d'organiser leur soutien. Avec des articles traitant de questions politiques pertinentes telles que le gerrymandering et des sujets supplémentaires tels que les droits civiques et la sécurité nationale, ce site représente une excellente opportunité de comprendre et de découvrir ce qui se passe sur la scène politique locale.
99. Gallup
Ce site héberge les célèbres sondages Gallup. Gallup se spécialise dans les analyses qui permettent aux décideurs organisationnels de résoudre des problèmes grâce à une approche de résolution de problèmes basée sur les données. De plus, le dispositif proposé par Gallup est souvent utile pour des solutions de conduite. Il s’agit d’une source reconnue comme la référence en matière de données et d’analyses avancées. Parcourez simplement le site pour découvrir des rapports sur tout, de l'état du lieu de travail mondial aux discussions sur la productivité aux États-Unis.
100. Bibliothèque de Berkeley
La bibliothèque de Berkeley héberge sur son site une compilation complète de statistiques et de données pour la recherche en science politique. Sur cette page, les chercheurs trouveront une tonne de liens qui leur permettront d'accéder à un certain nombre d'ensembles de données ainsi que la possibilité de créer les vôtres. Parmi ceux-ci figurent les statistiques historiques des États-Unis (HSUS), l'édition millénaire, Data Planet, ProQuest Statistical Insight et le Consortium interuniversitaire pour la recherche politique et sociale. Il y a plusieurs heures de données à parcourir.
Pour ceux qui ne le savent pas, la RAND Corporation est une organisation spécialisée dans la recherche sur les défis des politiques publiques. Avec des clients et un portefeuille qui couvre tous les niveaux de gouvernement, la société est une source de recherche de qualité aux fins de prise de décision. La succursale américaine de la société héberge un ensemble de bases de données statistiques sur son site Web. Ici, les chercheurs peuvent trouver des informations sur l'éducation de la maternelle à la 12e année, la santé, les affaires et l'économie, entre autres catégories qui abordent des questions pertinentes pour le bien public.
102. Centre Roper pour la recherche sur l'opinion publique
Géré et exploité par l'Université Cornell, le Roper Center for Public Opinion Research est spécialisé dans la collecte, la distribution et la préservation des données sur l'opinion publique. À titre d'exemple du type d'informations que le Roper Center peut découvrir, les chercheurs peuvent avoir accès aux données des élections américaines ainsi qu'à un lien vers une archive de plus de 23 000 ensembles de données. Que les journalistes recherchent la réaction du public à la politique ou à une récente alerte sanitaire, ce site est presque certain de contenir des informations.
103. Gouvernement des transports
Propulsé et exploité par le Bureau of Transportation, ce site contient des données qui couvrent un large éventail de sujets liés aux transports. Les ressources de ce site comprennent des rapports sur l'énergie, la sécurité des passagers, l'énergie, la performance du système, l'économie des transports, les infrastructures et le transport de marchandises. Les utilisateurs peuvent même trier et accéder aux données proposées sur ce site par emplacement et géographie. Il s'agit d'un site qui permet aux chercheurs de découvrir tout ce qu'ils peuvent espérer savoir sur des sujets liés aux transports.
104. Commerce du voyage
Travel Trade est un site qui héberge des données concernant les départs de citoyens américains datant de 1996 à 2016 au moment d'écrire ces lignes. L'objectif déclaré de cette ressource est d'aider les membres intéressés du grand public à comprendre comment le tourisme mondial et le tourisme international ont fonctionné au fil des ans. Disponible à la fois en téléchargement et en visualisation en ligne, il s’agit d’une information accessible. Les chercheurs peuvent facilement utiliser ces données pour trouver des tendances et faire des comparaisons.
105. Débarquement
Skift est un site qui vise à fournir des renseignements et des données à l'industrie du voyage. Entre autres sources de données, la société organise des recherches, des conférences et des newsletters informatives parmi lesquelles les abonnés et les chercheurs peuvent choisir. Skift examine des sujets que les individus du secteur du voyage voudraient connaître, tels que les endroits où les gens voyagent de plus en plus, l'identification de nouveaux marchés et de nombreuses informations supplémentaires sur la technologie du voyage que les chercheurs ont la possibilité d'explorer.
106. Geoba.se
Geoba.se est le site idéal pour les personnes qui veulent connaître les faits et rien que les faits sur une ville ou un lieu. En utilisant le moteur de recherche sur la page d'accueil, il suffit de quelques touches pour trouver des coordonnées, des informations sur les voyages, la météo et même des images de webcam locales. Le site héberge également une page qui fournit des informations sur les classements mondiaux qui peuvent être affinés par région et par pays. En bref, il s'agit d'une ressource qui fournira des données et des statistiques pures.
US Travel héberge un site exploité et maintenu par le Département d'État américain. La mission déclarée du site est de protéger la vie des citoyens américains qui partent à l'étranger. En tant que telle, cette source héberge des statistiques, des informations et des rapports sur des sujets tels que les passeports américains, les visas américains, les adoptions internationales, les décès à l'étranger et les enlèvements internationaux d'enfants par des parents. Les informations peuvent être utilisées lors de la planification des voyages, mais peuvent également être utilisées pour identifier les tendances à long terme avec les statistiques s'étendant de 1996 à 2016.
108. Service de données au Royaume-Uni
Financée par le Conseil de recherches économiques et sociales, la collection du UK Data Service publie un large éventail de données. Ce site contient des informations comprenant des éléments tels que des données commerciales, des enquêtes transnationales, des enquêtes parrainées par le gouvernement britannique et même des données de recensement britanniques. Fondamentalement, le site Web a été conçu en tenant compte des besoins des étudiants et des chercheurs. De plus, il existe des guides, des ressources et des instructions qui proposent des guides et des ressources qui aideront les chercheurs à comprendre et à utiliser rapidement les outils de ce site.
109. Data.gov.au
Géré et publié par le gouvernement australien, Data.gov.au offre un accès et une recherche faciles aux données ouvertes. Ce site souligne explicitement que les données gouvernementales peuvent être utilisées pour développer des outils et des applications qui peuvent à leur tour être utilisées au profit des Australiens. Non seulement l'accès aux ensembles de données ouverts est fourni, mais il existe également des données non publiées accessibles moyennant des frais. Pour les chercheurs qui souhaitent effectuer une analyse encore plus approfondie, le site propose également une boîte à outils de données.
110. Twitter
Tout le monde connaît Twitter pour ses conversations rapides, ses messages courts et son statut dans la culture populaire en tant que plaque tournante des dernières nouvelles. Ce que beaucoup de gens ne savent pas, cependant, c'est que Twitter dispose également d'outils de développement qui facilitent le filtrage et la découverte d'informations. Ces outils permettent même aux chercheurs de visualiser les tendances et de filtrer par géographie. Qu'il s'agisse de lire les hashtags tendances ou d'explorer les outils de développement, Twitter est une ressource que les journalistes utilisent depuis un certain temps.
111. Instagram
Instagram n'est pas uniquement destiné à aimer les jolies photos de chats et les adorables photos de bébés. Ou du moins, ça n'a pas à l'être. L'application dispose d'un ensemble d'outils de développement étonnamment sophistiqués qui facilitent la compréhension et la recherche sur le public. De plus, les hashtags et les indices révélés par les photos que les gens publient ainsi que les individus qui y sont tagués peuvent être une mine d'informations. Instagram est un moyen utile de découvrir les tendances dans différents secteurs.
112. Quatre carrés
Pour le type de recherche où l'emplacement est important, Four Square est une source de données utile en raison de sa base de données volumineuse et de toutes les informations qu'elle a compilées. En apparence, il dispose d'un guide de la ville qui fournit des recommandations aux utilisateurs sur la force de la communauté. Four Square dispose également d'outils de développement qui permettent d'accéder à des informations supplémentaires via la base de données Places. Les journalistes peuvent l'utiliser pour en savoir plus sur des lieux spécifiques et sur les personnes qui utilisent l'application.
113. New York Times
Considéré par beaucoup comme un membre estimé du Quatrième pouvoir, rares sont les journalistes qui n'ont pas entendu parler du New York Times. Ce qui est souvent négligé, cependant, c'est l'utilisation du New York Times comme source de données via son API. Les chercheurs peuvent trouver des articles remontant à 1851 par mois, rechercher des articles et même trouver des critiques de livres. Cette API permet d'effectuer des recherches basées sur des vues, des partages et des e-mails et même de rechercher et d'accéder à des commentaires.
114. PA
L’Associated Press occupe une place permanente dans la culture populaire en tant que source d’informations actuelles et précises. Grâce à ses outils de développement, c'est également une source de données utile pour les journalistes. Au moment d'écrire ces lignes, les chercheurs peuvent utiliser ces outils pour créer leur propre montage tout en téléchargeant des images et des vidéos. Le niveau de contenu semble dépendre du type de plan utilisé par les chercheurs, mais l'API d'Associated Press permet néanmoins aux utilisateurs de faire passer le processus de recherche à un autre niveau.
115. Cinq trente-huit
Les journalistes connaissent peut-être déjà Nate Silver et Five Thirty Eight et son modèle statistique en raison de ses prédictions parfois inattendues mais généralement correctes. Five Thirty Eight dispose d'un GitHub qui héberge des ensembles de données ainsi que du codage utilisé au cours de l'histoire du site. Les ensembles de données présentent des sujets amusants comme les données sur les mauvais conducteurs, les Avengers et l'enquête sur l'étiquette en vol. Parallèlement, il existe également des dossiers qui traitent de questions un peu plus graves comme la sécurité aérienne et les crimes haineux.
116. IMDb
IMDb est considéré par beaucoup comme le site le plus complet du Web en ce qui concerne l'industrie du cinéma et du théâtre. S'il y a un film qui sort et que les gens veulent savoir qui y joue ou voir la réaction générale du public cinéphile, il y a de fortes chances qu'ils atterrissent sur ce site à un moment donné au cours de leur recherche. IMDb héberge également un certain nombre d'ensembles de données actualisés quotidiennement et disponibles pour une utilisation commerciale et non commerciale.
117. KAPSARC
KAPSARC est un portail de données qui héberge un total de 923 ensembles de données contenant des informations spécifiques sur les données énergétiques. Ces ensembles sont divisés en quelques thèmes généraux concernant la consommation d'énergie, l'approvisionnement en énergie et d'autres facteurs pertinents tels que les politiques, la démographie, l'environnement, le commerce, l'eau et les informations économiques. Pour les chercheurs qui s'intéressent à l'énergie et à la manière dont elle est utilisée dans différentes industries et secteurs, KAPSARC est l'une des sources de données énergétiques les plus complètes du Web.
118. Macroactifs
Asset Marco est un site qui fournit des données financières historiques et des indicateurs macroéconomiques. Ces données couvrent plus de 75 000 actions, devises, matières premières et obligations dans le monde entier. En outre, le site propose plus de 120 000 indicateurs macroéconomiques que les utilisateurs peuvent utiliser pour explorer les données financières de différents pays. En plus de toutes ces données sur les marchés financiers, le site aborde également les stratégies d'investissement. Cette source est tout à fait unique en raison du grand volume d’informations qui peuvent être trouvées.
119. Services Web du gouvernement américain et sources de données XML
Les services Web du gouvernement américain et les sources de données XML sont hébergés sur un site appelé USGovXML.com. Ici, les utilisateurs peuvent parcourir les différentes sources de données XML et services Web fournis par le gouvernement américain. Ce simple acte de préservation maintient ces sources Web transparentes et accessibles au public. Pour les chercheurs qui surveillent régulièrement cet index en général, il est possible de trouver une histoire dans les données en cas de changement soudain dans les données XML.
120. Partage de figues
Figshare est un site qui héberge plus de 5 000 éléments de contenu scientifique disponibles pour la recherche universitaire et les citations. En plus des informations qu'il contient, le site est conçu pour offrir aux chercheurs un emplacement unique pour compiler, télécharger, stocker et gérer les recherches qu'ils trouvent. Les mathématiques, les sciences de la santé, l'ingénierie, la chimie, les sciences biologiques et les sciences sociales sont toutes répertoriées comme catégories vedettes. Ce site est une excellente source pour les journalistes à la recherche de ressources académiques supplémentaires.
121. Données liées
LinkedData est un site dédié à l'idée de trouver de nouvelles façons de connecter des données Internet qui n'étaient pas liées auparavant. Ici, les utilisateurs trouveront des didacticiels, des guides et des ensembles de données qui feront avancer l'histoire. Les ensembles de données se concentrent tous sur le thème de l'implication dans la communauté des données liées, et outre la liste d'achats de données liées, la plupart sont classés comme URI déréférençables avec ou sans le format RDF complémentaire. Pour en savoir plus sur cette communauté, ce site est un incontournable.
122. Le mineur Web
Le Web Miner est l'endroit idéal pour les chercheurs qui souhaitent collecter toutes les données génériques qu'ils peuvent trouver avec le programme. Ce site héberge des exemples de bases de données telles que des restaurants américains, des codes SWIFT de banques du monde entier, des stations-service américaines, des attractions touristiques américaines et des applications Google Play, entre autres listes massives. À tout le moins, c'est un site qui permettra aux journalistes de parcourir plus facilement et plus rapidement et de découvrir d'énormes quantités de données en beaucoup moins de temps.
123. Centre de données
Data Hub est fier d'être un endroit où les utilisateurs peuvent trouver et publier des données aussi rapidement et efficacement que possible. Le site lui-même héberge un certain nombre d'ensembles de données. L'indice des prix de l'immobilier (Case-Shiller), le prix mensuel de l'or et les tendances actuelles du dioxyde de carbone atmosphérique sont les trois plus populaires. En plus des données, le site héberge également un certain nombre de didacticiels que les utilisateurs peuvent suivre afin d'en savoir plus sur la navigation dans les différents types de données disponibles.
124. Énigme publique
Sur son site, Enigma Public se présente comme « la plus vaste collection de données publiques » disponible sur le Web. Les ensembles de données appartiennent à l'une des quatre grandes catégories suivantes : FOIA, Essentials, Newsworthy et Under the Radar. Certaines des données présentées sur ce site incluent les salaires des employés de la Maison Blanche et les permis fédéraux actifs d'armes à feu. Après avoir créé un compte gratuit, les utilisateurs peuvent accéder à n’importe laquelle des catégories de données disponibles pour la visualisation.
125. Yahoo
La plupart des internautes connaissent le nom Yahoo en raison de Yahoo! Actualités et Yahoo! Financez parmi les nombreuses propriétés en ligne de l'entreprise. Ce qui intéresse les chercheurs et les journalistes, c'est le fait que Yahoo héberge également un grand nombre d'ensembles de données, notamment Yahoo! Notes des utilisateurs de musique sur les chansons avec les méta-informations sur l'artiste, l'album et le genre, v. 1.0 et Yahoo! Évaluations des utilisateurs de films et informations descriptives sur le contenu, v.1.0 pour n'en nommer que deux. Les journalistes en quête de nouvelles statistiques ne peuvent pas se tromper avec cette source.
126. 1000 génomes
1000 Genomes héberge un projet du même nom qui s'est déroulé de 2008 à 2015. Le but du projet était de trouver toutes les variations génétiques pouvant survenir dans au moins 1% des populations étudiées. Parallèlement aux publications résultant de ce projet, il existait également des ensembles de données massifs comprenant des bases de données distinctes de cellules variantes, des fichiers de séquences brutes et la disponibilité d'échantillons. Ces données peuvent être consultées ou téléchargées.
127. CBOE
CBOE est une bourse à terme qui se concentre principalement sur les contrats à terme sur volatilité. En particulier, le site propose de nombreux documents concernant les contrats à terme qui figurent sur l'indice de volatilité du site. Le site héberge des données de marché de toutes sortes, notamment des données historiques, des statistiques quotidiennes du marché et les prix de règlement quotidien des contrats à terme VX. Pour les journalistes qui recherchent des données de marché de qualité, CBOE est un site qui peut fournir ces informations dans un format facile à suivre et à comprendre.
128. Fed de Saint-Louis
La Banque fédérale de réserve de Saint-Louis est l’un des centres financiers les plus importants de sa région, sinon le plus important. Sur le site Web, les chercheurs peuvent consulter directement des documents de travail, des données économiques, des publications et des services d'information. En d’autres termes, les informations ne manquent pas sur la pensée actuelle et passée de la Fed de Saint-Louis en termes de politique ainsi que sur la capacité d’évaluer l’efficacité de la Banque de Réserve fédérale de Saint-Louis. Pour les journalistes commerciaux, financiers et économiques, il s’agit d’une ressource d’information de premier ordre.
129. OANDA
OANDA est une plateforme de négociation d'actions en ligne populaire, qui négocie principalement des CFD et des changes. En plus des nombreuses fonctionnalités ajoutées au trader dans le but d'attirer les traders en ligne, OANDA héberge également de nombreuses données de taux historiques ainsi que des informations historiques sur le convertisseur de devises sur le site. Parallèlement à toutes ces données, le site propose également des informations sur les stratégies d'investissement ainsi que des actualités et des analyses de marché. Un compte n'est même pas nécessaire pour accéder à la plupart de ces données.
130. abdos
Le Bureau australien des statistiques, ou ABS, comme son homologue américain, propose des données objectives, des informations économiques et des recherches sur un large éventail de sujets pertinents pour le pays. Directement sur le site lui-même, les chercheurs peuvent rechercher des données statistiques sur les indicateurs économiques, les soins de santé, le logement, la finance, le commerce international, le logement, la santé mentale, ainsi que les indices de prix et l'inflation. Les journalistes peuvent effectuer des recherches pour trouver des enquêtes et des informations plus anciennes, qui peuvent également trier les informations par région.
131. Base de données de Londres
Conçue et gérée à l'origine par la Greater London Authority, la London Database est la tentative de Londres de rendre les données de Londres plus accessibles au public. L’objectif final est de permettre aux gens d’accéder à ces informations tout en les encourageant à les utiliser gratuitement comme ils le souhaitent. Sur ce site Web, les utilisateurs peuvent rechercher des données par sujets tels que les arts et la culture, la criminalité et la sécurité communautaire, l'éducation et la santé. Les journalistes intéressés par ce type de données peuvent désormais les obtenir directement auprès du gouvernement local.
132. Statistiques Nouvelle-Zélande
Le gouvernement néo-zélandais héberge une tonne de statistiques et de données que les chercheurs peuvent approfondir et analyser sur ce site. Ces informations peuvent être passées au crible à l'aide de la barre de recherche en haut, en filtrant par emplacement et par région, ainsi que par sujet. Certains des sujets comprennent les indicateurs économiques, la santé, le revenu et le travail, les secteurs industriels, l'environnement et les affaires. Entre les sources d'information supplémentaires et les communiqués mettant en évidence diverses conclusions et statistiques, les journalistes découvriront toutes sortes de statistiques spécifiques à la Nouvelle-Zélande grâce à ce site.
133. Bureau de météorologie du gouvernement australien
Géré et exploité en fin de compte par le gouvernement australien, le site Web du Bureau australien de météorologie présente des informations météorologiques relatives aux différentes villes et régions d'Australie. Selon le site, cette agence a été créée pour aider les Australiens à faire face au climat qui les entoure grâce à une combinaison d'avertissements et de conseils. Ici, les chercheurs pourront trouver des perspectives saisonnières, le stockage de l'eau, les prévisions de précipitations, la variabilité climatique et les prévisions saisonnières de débit des cours d'eau. Sur ce site, vous trouverez une couverture précise et fiable de la météo australienne.
134. GroupeLens
Ce site est disponible sur le Web avec l'aimable autorisation de GroupLens du Département d'informatique et d'ingénierie de l'Université du Minnesota. Le site propose des publications ainsi que des ensembles de données à des fins de recherche. Il y a un total d'environ six ensembles de données. Parmi les ensembles nommés, il y en aurait quelques-uns intitulés Book-Crossing, MovieLens et HetRec 2011. Bref, il s'agit d'une ressource utile pour les journalistes qui cherchent à mieux comprendre comment utiliser les données fournies.
135. Pépites KD
KD Nuggets est un site qui vise principalement à fournir aux utilisateurs la science des données, l'analyse commerciale, l'apprentissage automatique et l'exploration de données. Il y a une page sur le site qui contient une liste complète des ensembles de données que les gens utilisent pour explorer davantage l'exploration de données et le Big Data avec des ensembles de données tels que Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett et Datamob, tous liés. Il s'agit d'une ressource fantastique pour les journalistes qui préfèrent avoir toutes les informations sur une seule page.
137. Microsoft
Tous ceux qui ont utilisé un PC ou un ordinateur portable ont probablement entendu parler de Microsoft, au moins en passant. Chose intéressante, en plus des PC, des ordinateurs portables et des logiciels, Microsoft héberge également de nombreuses recherches et publications. Cela inclut des avancées telles que la quête de l'entreprise pour créer des machines compétentes ainsi que la science des données basée sur le cloud. Il existe également des informations supplémentaires sur les outils développés par Microsoft, tels que Visual Studio Code Tools et les développements de l'IA qu'ils représentent.
138. RDataMining
Exactement comme il est écrit sur la boîte, R Datamining est une ressource sur R et le datamining. Le site fournit de nombreux exemples et documents qui donnent une perspective approfondie sur le data mining et le data mining avec R. De plus, il existe également des liens vers des formations telles que le cours de courte durée proposé par l'Université de Canberra. Cela inclut des liens vers des ensembles de données et des présentations gratuits ainsi que des ensembles de données qui couvrent des sujets tels que les données d'avion, de compagnie aérienne et d'itinéraire, ainsi que des liens vers des sites comme GeoDa.
139. Recherche collaborative en neurosciences computationnelles – Partage de données
La recherche collaborative en neurosciences computationnelles, également connue sous le nom de CRCN, dispose d'un certain nombre d'ensembles de données accessibles via son site. Les ensembles de données sont classés selon les différentes parties du cerveau telles que le cortex visuel, l'hippocampe, le cortex moteur, les mouvements aviaires, les yeux et l'aplysie, pour ne citer que quelques exemples. Ces dossiers comprennent également des défis, des outils, des simulations et des méthodes. La possibilité de partager ces données en fait une ressource encore meilleure à utiliser pour la recherche.
140. Archives de la banque de données sur les protéines
Selon son site Web, les archives de la Protein Data Bank constituent une ressource de premier ordre sur les acides nucléiques, les structures 3D des protéines et les assemblages complexes depuis 1971. Créées avec la mission explicite de conserver ces informations dans le domaine public, les chercheurs peuvent accéder ici pour consulter la validation. rapports et dictionnaires de données en ligne. Des croissances de données et des statistiques d'utilisation sont également disponibles pour le tri et l'analyse sur le Web ainsi que pour le téléchargement. Mieux encore, le site ajoute toujours de nouvelles informations.
141. Le projet PubChem
PubChem, en tant que projet officiel, a été conçu dans le but d'informer le public sur ce que les petites molécules sont capables de faire d'un point de vue biologique. Le site est lié à trois bases de données, dont PubChem Compound, PubChem Substance et PubChem BioAssay. De plus, le site permet également de rechercher les similitudes entre différentes protéines. Pour les chercheurs qui font passer leur analyse de données au niveau supérieur, le site propose également du codage et des conseils gratuits.
142. Coremine Médical
Coremine Medical est une ressource inestimable pour toute personne recherchant des informations sur la biologie, la santé et la médecine. Maintenant que la capacité d'exploration de textes biomédicaux de PubGene a été intégrée dans sa forme actuelle, Coremine est également l'une des sources d'informations biomédicales les plus flexibles du marché. Ce site affichera des liens entre les concepts et les idées dans un format visuellement attrayant et facile à comprendre qui n'aurait peut-être pas été remarqué autrement. Il s'agit sans doute de l'une des sources de données biomédicales les plus complètes dont disposent les journalistes.
143. Ton temps
Tu Tiempo est une incroyable source de données météorologiques et climatiques pour tous les pays du monde. Grâce à cette ressource, il est facile de trouver des moyennes annuelles, mensuelles et quotidiennes pour pratiquement toutes les villes et régions du monde. En outre, les utilisateurs peuvent également effectuer des recherches dans la base de données de plus de 115 millions d'enregistrements remplis de données historiques dans lesquelles toute personne peut effectuer des recherches. Selon la région recherchée, il est possible de trouver des données remontant à 1929.
144. Ressources réseau complexes
Il s'agit d'un site qui donne accès à une grande partie des données qui ont été utilisées pour la première fois dans ses expériences informatiques. La liste complète des ensembles de données répertoriant les types de données, notamment les graphiques d'actualités, les graphiques biologiques, les graphiques de citations, les graphiques de collaboration, les graphiques techniques et les graphiques sémantiques. La page renvoie également à une liste de sources contenant de nombreuses informations, telles que l'ensemble de données qui a examiné environ 3 millions de brevets américains. La page propose également une compilation impressionnante d’ensembles de données de réseaux complexes.
145. Scopus
Scopus est un outil qui permet aux individus de trouver rapidement et facilement des recherches et des citations académiques. Le site offre une base de données incroyablement complète sur les recherches effectuées dans le monde entier dans un certain nombre de domaines comprenant des secteurs tels que la médecine, la technologie, les sciences sociales, ainsi que les arts et les sciences humaines. Utilisez Scopus pour capturer des sources académiques qui auraient pu être négligées. Après tout, dans de nombreux milieux, la qualité d’une source académique peut être presque aussi importante que l’information qu’elle fournit.
146. Stanford
La réputation de Stanford en tant qu'institution universitaire prestigieuse n'est pas le fruit du hasard. L'excellence transparaît dans ses cours liés à la programmation. Le site héberge également un certain nombre d'ensembles de données contenant des détails tels que des informations sur les réseaux sociaux. Il existe des ensembles de données centrés sur les cercles sociaux sur Facebook, la demande d'administration de Wikipédia, les cercles sociaux de Twitter et Google +. Les réseaux de communication et Amazon Product Network disposent également de leurs propres ensembles de données.
147. Université de Milan
Le Département des sciences de l'information de l'Université de Milan gère et exploite une page Web connue sous le nom de Laboratoire d'algorithmes Web. Ce site héberge de nombreux ensembles de données destinés à l'exploration. Il s'agit notamment de graphiques relatifs aux réseaux sociaux, de graphiques Facebook, d'instantanés du projet DELIS et d'une courte liste de données diverses. Les informations disponibles ici peuvent être consultées en ligne et téléchargées si vous le souhaitez, ce qui en fait l'un des ensembles de données les plus accessibles de ce type sur le Web.
148. Référentiel de données du réseau UCI
L'UCI Network Data Repository est un site dédié à l'adoption d'une approche scientifique de l'étude des réseaux. Sur la page des ressources, les chercheurs trouveront des liens vers des répertoires d'ensembles de données sélectionnés par des organismes et des groupes de recherche ainsi que par des individus. Il dispose également d’une collection d’ensembles de données qui seraient généralement utilisés pour l’analyse des médias sociaux. Ceux qui fouillent dans les données seront heureux de constater que ces ensembles sont également disponibles en téléchargement.
149. CAIDA
CAIDA, ou Centre d'analyse appliquée des données Internet, collecte un large éventail de données provenant de différents endroits, souvent avec l'aide de différentes organisations et individus. Il existe des ensembles de données hébergés sur ce site, tels que AS Relations, DDOS Attacks, Telescope et ceux associés, ainsi que d'autres données. Les catégories incluent le trafic, la topologie, la sécurité, le résumé des vers et les statistiques récapitulatives du trafic. Les ensembles de données peuvent nécessiter un accès sur demande, mais beaucoup, sinon la plupart, sont publics.
150. Crawdad
Crawdad, ou la ressource communautaire pour l'archivage des données sans fil à Dartmouth, est unique en raison de son objectif de fournir des données sans fil aux chercheurs et à toute autre personne susceptible d'être intéressée par le sujet. Le site propose de nombreux outils ainsi qu'un accès à de nombreux ensembles de données. Parmi les ensembles répertoriés figurent ceux qui font référence à l'utilisation éducative, à la caractérisation des erreurs de bits, au diagnostic de réseau, à la connectivité opportuniste, à l'informatique géolocalisée et bien d'autres encore. Les chercheurs apprécieront cette ressource à mesure qu’ils s’y plongeront.
151. Administration américaine d’information sur l’énergie
Souvent appelée EIA, la US Energy Information Administration a pour mission de fournir au public des données annuelles sur les services publics d’électricité. Les informations contenues dans ces données couvrent, entre autres options, les stocks de combustibles fossiles, la consommation de carburant, les informations mensuelles et annuelles sur la production d'électricité et les données environnementales. Les données sont là et disponibles pour analyse datant des années 2001 à 2017. Il suffit aux chercheurs de naviguer sur le site et de télécharger les informations.
152. Données océanographiques britanniques
Financée par le National Environment Research Council, British Oceanographic Data est l’une des sources de données marines les plus accessibles sur Internet. Avec une base de données étendue qui touche aux courants, aux profils CTD, aux données internationales sur le niveau de la mer, aux courants et même aux données historiques des enregistreurs de pression de fond. De plus, des ensembles de données se trouvent dans la bibliothèque de données publiées qui offre un accès supplémentaire au catalogue. Il s’agit probablement de l’une des sources d’informations marines les plus complètes disponibles en ligne.
153. Factuel
Factual fournit des données de localisation à des fins publicitaires et à utiliser sur les plateformes mobiles. Les outils de développement qui incluent le SDK Engine Mobile et les applications professionnelles et de recherche complètes de l'Observation Graph ainsi que de la pile de validation locale sont particulièrement intéressants pour les chercheurs. Avec un surnom de site Web qui met l'accent sur la passion de l'entreprise pour l'exploitation des données à travers le monde et la recherche de nouvelles façons de les mettre en contexte, Factual s'engage clairement en faveur des données et de la recherche de nouvelles opportunités peu orthodoxes pour les utiliser.
154. Zones administratives mondiales
Les zones administratives mondiales sont une géodatabase qui montre où se situent les différentes zones administratives du monde. Les données recueillies à partir de ce type de base de données sont ensuite généralement utilisées dans les systèmes d'information géographique. Ceux-ci incluraient des pays et seraient divisés en provinces, comtés et départements, entre autres. La bonne nouvelle pour les journalistes est que toutes ces données sont disponibles gratuitement et peuvent également être utilisées à des fins académiques et générales non commerciales.
155. Noms géographiques
Geonames est un site qui héberge une base de données géographique contenant des millions d'entrées, des caractéristiques uniques et des noms alternatifs. Offrant à la fois une option d’exportation et un accès via une variété de services Web, il s’agit d’une base de données qui traite environ 150 millions de demandes chaque jour. Grâce aux capacités wiki de la base de données, les utilisateurs peuvent apporter des ajustements et des modifications aux entrées de la base de données avec une relative facilité. Il s’agit d’une excellente ressource pour les seules capacités d’hébergement multilingues.
156. Données naturelles sur la Terre
Natural Earth Data est un ensemble de données cartographiques disponibles dans le domaine public et rempli d'informations conçues pour être utilisées dans les logiciels de cartographie pour la création de cartes de pointe. Les visuels du produit final sont soignés et bien organisés et les données peuvent être utilisées immédiatement. Cet ensemble de données comprend la présence de données de renseignement et divers thèmes de données vectorielles culturelles, raster et physiques. Créé à l’origine en tenant compte des besoins et des préférences des cartographes, cet ensemble de données est utile à toute personne s’intéressant à la géographie.
157. Carte d'Openstreet
Openstreet Map est moins un site Web qu'une collaboration entre utilisateurs qui fournit désormais des services de cartographie aux applications, sites et divers périphériques matériels. Ce site acquiert de nouvelles données lorsque les utilisateurs saisissent des informations sur des points de repère moins connus tels que des gares ferroviaires, des routes et des sentiers. L’ensemble des données complet est disponible gratuitement sur le site et peut être téléchargé en totalité ou en partie. Pour ceux qui choisissent de télécharger partiellement les données, il est également possible de les télécharger par région.
158. Ville de Chicago
La ville de Chicago abrite le championnat des Bulls de Michael Jordan et son propre style de pizza, et elle dispose également de son propre portail de données complet. Les catégories d'ensembles de données couvrent une variété de sujets, notamment l'administration et les finances, l'éthique, la santé et les services sociaux, les parcs et les loisirs, la sécurité publique et la préservation historique. En bref, le portail de données de la ville de Chicago héberge pratiquement tout ce qui pourrait intéresser les chercheurs, les décideurs politiques et les journalistes locaux.
159. CKAN
CKAN est essentiellement le site en ligne du projet de données ouvertes de la ville de Glasgow. Ce site contient des ensembles de données sur de nombreux sujets qui sont utiles aux entrepreneurs, aux décideurs politiques, aux chercheurs universitaires et aux développeurs d'applications. Parmi les 360 ensembles de données hébergés ici, certains sont liés à la gouvernance de la ville, comme l'ensemble de données sur le parc immobilier par mode d'occupation, tandis que d'autres, comme l'ensemble de données sur le cyclisme, présentent un intérêt particulier pour les résidents locaux. Il y a toutes sortes d'informations ici pour les journalistes qui couvrent un rythme plus local.
160. Gouvernement de l'Inde
Le gouvernement indien dispose d'un site Web qui couvre les analyses et les ressources de données dans sa version du projet Open Data. Actuellement, il existe environ 137 940 ressources qui ont été consultées des millions de fois sur le site. La grande majorité de ces fichiers sont également disponibles en téléchargement sur le site. Qu'il s'agisse de chiffres sur le budget gouvernemental ou d'ensembles de données traitant de la santé et du bien-être familial, il y a de fortes chances que ce site ait des ressources à offrir.
161. Stats SA
Ce site regorge de statistiques, de publications et de données à jour recueillies par le gouvernement sud-africain. Ici, les chercheurs découvriront des informations sur tout, depuis les enquêtes sur les aliments et les boissons jusqu'aux indicateurs économiques, en passant par les statistiques de l'emploi, les chiffres de la population et d'importantes statistiques sur la santé. Il est possible de rechercher les chiffres par ville, thème et indicateur en fonction des besoins. Ce site héberge de nombreuses informations sur le recensement tout en diffusant également des publications statistiques, des questionnaires, des codes et classifications ainsi que la politique de tarification.
162. Développement de politiques et recherche
Ce site est publié sous l'égide du Bureau de développement et de recherche des politiques du Département américain du logement et du développement. Il publie régulièrement chaque année un grand nombre d'études de cas, de publications semestrielles et de périodiques. Il propose également un grand nombre d'ensembles de données qui pourraient intéresser les journalistes, les loyers équitables du marché, les limites de revenu et les facteurs d'inflation du financement de renouvellement n'étant que quelques-uns des ensembles auxquels le public a accès sur ce site.
163. Données vitales sur la santé du Net
Chez Vital Net Health Data, les chercheurs trouveront de nombreux ensembles de données importants liés à la santé. Ce site n'héberge pas tant tous ces ensembles qu'il propose des liens vers des ensembles que les gens peuvent visiter et trouver des informations. Cette liste organisée renvoie à des ressources telles que CDC Wonder, Eurocat, Health Data All Star, ainsi qu'au travail d'organisations caritatives telles que la North American Association of Central Cancer Registries. Il s’agit sans conteste de l’une des ressources d’ensembles de données sur la santé les plus complètes qui soient.
164. Pont analytique
Analytic Bridge est une ressource dédiée à la business intelligence. Ici, les chercheurs trouveront des discussions sur l'apprentissage automatique et l'IA, des liens vers des webinaires et des conférences, et même un onglet de recherche d'emploi. Le site héberge également Data Science Central, qui est la partie du site axée sur le Big Data. Grâce à sa communauté active et engagée et à son engagement à fournir des actualités et des informations, les journalistes intéressés par les implications des données pour les entreprises ont beaucoup à y gagner.
165. Archives.org
Connue principalement pour ses efforts visant à devenir une bibliothèque publique en ligne, archive.org héberge de nombreux ouvrages publiés ainsi qu'une importante collection de données. Le site présente les résultats du recensement Internet de 2012 ainsi que les archives du Dark Net Market de 2011 à 2015, et même un ensemble de données de commentaires publics sur Reddit. Il existe des sauvegardes de données de Music Brainz et un ensemble de données contenant des images de couverture audio. Entre ses publications et ses données, archive.org propose de nombreux documents aux journalistes.
166. Torrents académiques
Ce site Web se présente comme un système conçu pour faciliter le partage et le téléchargement d'énormes ensembles de données. Utilisant la technologie torrent pour simplifier la distribution des données, Academic Torrents est fier de permettre aux chercheurs de télécharger rapidement tout ce dont ils ont besoin. Le site héberge également des articles, des cours et des collections à consulter. Une recherche rapide dans les ressources disponibles révélera qu'il existe des tonnes d'ensembles de données et de collections disponibles en téléchargement ici.
167. Vers de données
La meilleure façon d’aborder Dataverse est de le considérer comme un autre type de bibliothèque. Ici, les chercheurs peuvent facilement rechercher, découvrir et citer des données tout en utilisant simultanément ce site comme référentiel pour leurs propres informations. Les matières couvertes comprennent des domaines tels que les sciences sociales, les sciences agricoles, la médecine, la santé et les sciences de la vie, ainsi que les sciences de la terre et de l'environnement. Les grands noms ayant publié sur ce site incluent Gallup et le Département américain du Commerce, Bureau of Census, Geography Division.
168. DONNÉES CU
Opérant en collaboration avec le Social Science Data Lab de l'UC Berkeley, UC Data est l'archive la plus importante et la plus connue de l'université. Ce site propose des offres dans les domaines des statistiques et des données des sciences sociales. Sur ce site, les chercheurs peuvent accéder aux articles, rapports et documents de travail produits par les chercheurs d'UC Data. Les données brutes couvrent de nombreux domaines de recherche, notamment les soins de santé, la protection sociale et l'assurance sociale, la démographie, le vote et les technologies de l'information, parmi une foule d'autres sujets.
169. Camp de blagues
Joe Kamp propose un guide complet pour trouver des données et des API sur le football et le football à des fins d'analyse des données. Si les chercheurs suivent les liens fournis sur la page, des données open source sont disponibles via GitHub ainsi qu'un accès à des API gratuites et commerciales pour un accès plus facile. Étant donné que les données et le codage sont disponibles sur un site reconnu comme GitHub, obtenir ce type de données n'a jamais été aussi simple.
170. Sean Lahman
Sean Laham n'est pas nécessairement un nom que les gens entendent tous les jours, mais son site héberge l'une des statistiques les plus complètes et les plus approfondies sur les frappeurs et les lanceurs sur Internet. Avec des chiffres couvrant la période de 1871 à 2016, les données remontent littéralement à plusieurs siècles. Les données sont libres d'accès et d'utilisation sous la licence Creative Commons Share Alike 3.0 et peuvent être téléchargées directement dans SQL et Microsoft Access, pour n'en nommer que quelques-uns. Les statistiques peuvent également être téléchargées via GitHub.
171. Feuille rétro
Retro Sheet est l’une des sources les plus complètes sur Internet de statistiques et de données sur le baseball. Le site comprend des détails tels que les listes annuelles et l'identification des arbitres, des joueurs et des entraîneurs. Pour les années où cela était pertinent, les données du match des étoiles étaient incluses dans les fichiers d'événements avec un ensemble de fichiers d'événements pour les séries éliminatoires et un petit fichier d'écarts. Retro Sheet propose même des identifications pour les parcs de baseball pour chaque saison. Comment est-ce que c'est approfondi ?
172. Le défi des données Hubway
Pour ceux qui ne connaissent pas bien le programme, Hubway est le nom du service de partage de vélos basé dans la zone métropolitaine de Boston. Bien sûr, le système n'a pas enregistré ni divulgué d'informations d'identification, mais Hubway dispose néanmoins des informations de base sur chaque voyage effectué entre juillet 2011 et septembre 2012. Cela comprenait des détails tels que le début et la fin du voyage ainsi que la station de retrait pour ne citer que quelques catégories.
173. Vols ouverts
Open Flights est une base de données contenant des informations sur plus de 10 000 terminaux de ferry, aéroports et gares ferroviaires à travers le monde. Les chercheurs peuvent trouver la version .csv compatible Excel via GitHub et peuvent également télécharger les données directement sur le site Web. En utilisant la carte sur la page d'accueil, il est possible de voir quels lieux spécifiques figurent sur la liste et le site va même jusqu'à proposer également des informations sur les itinéraires. Les propriétaires du site peuvent être contactés pour des informations encore plus récentes.
174. MLVIS
MLVIS est un référentiel de données qui combine l'analyse visuelle et l'exploration de données en temps réel. Cela permet d’explorer une compréhension plus intuitive des données, même en travaillant avec d’énormes ensembles de données. Les données de référence et l'apprentissage automatique des données non relationnelles ainsi que différents types de données tels que les données attribuées et hétérogènes font partie des nombreuses fonctionnalités et options disponibles sur ce site. Pour le confort des utilisateurs, ces informations peuvent également être téléchargées dans un format unique et cohérent.
175. Création de données ouvertes
Open Data Inception est un site qui propose des liens vers plus de 2 600 portails de données. En utilisant la barre de recherche en haut, les chercheurs peuvent rechercher des portails et des ensembles de données par catégorie et par thème. De plus, il est également possible d'utiliser le site pour trouver la version la plus récente de l'ensemble de données recherché. Profitez de la possibilité de visualiser les portails de données sous forme de liste ou sous forme visuelle interactive et commencez à trouver les données nécessaires.
176. OpenDataSoft
Disponible en français, anglais et allemand, OpenDataSoft est une source qui donne accès à 480 millions d'enregistrements, 4 millions de cellules API et 9 284 jeux de données. À l’aide de la barre de recherche au milieu de la page d’accueil, les chercheurs peuvent saisir un mot-clé ou une catégorie et y trouver l’ensemble de données le plus approprié. Pour les journalistes, il s’agit d’un moyen plus rapide de trouver les ensembles de données les plus pertinents nécessaires pour mener à bien la recherche en question. Visitez le site pour en savoir plus.
177. Maître de la nation
NationMaster est une source de données entièrement compilées provenant de plus de 300 pays et organisées en plus de 5 000 catégories. Les données couvrent des chiffres comprenant des chiffres sur le pourcentage de décès enregistrés, des statistiques sur la Seconde Guerre mondiale et même des informations sur la guerre et les essais nucléaires. Les chercheurs trouveront également des tableaux, des graphiques et des diagrammes circulaires qui permettront une visualisation plus approfondie des données. En termes simples, il y a tellement de sujets abordés qu'il y a toujours quelque chose de nouveau à découvrir dans les données.
178. Suiveur Wonk
Twitter est depuis longtemps un site de médias sociaux populaire pour les dernières nouvelles et les tendances. Followerwonk permet aux utilisateurs de faire passer leur utilisation de Twitter au niveau supérieur. Cela inclut la recherche d'utilisateurs Twitter avec lesquels se connecter, l'étude des abonnés actuels et la planification de l'activité Twitter pour des résultats optimaux. De nos jours, de nombreux journalistes et reporters sur Twitter utilisent le site pour créer des réseaux et diffuser des articles. Followerwonk rend les utilisateurs de Twitter plus productifs sur le site.
179. Infochimps
Infochimps est un site qui propose des services basés sur le cloud qui peuvent être réduits afin de tirer le meilleur parti du Big Data. C'est utile lorsqu'il s'agit de déployer et d'intégrer des technologies et des applications Big Data. Lorsque les chercheurs effectuent des recherches dans d’énormes quantités de données ou évaluent les tendances du Big Data, il s’agit d’une ressource inestimable. Il existe également de nombreux livres blancs et cas que les chercheurs peuvent consulter sur le site.
180. Statistiques gouvernementales nationales archivées
Fondé en 2006, Archive-It est un service fourni par Internet Archive. Ce service aide les organisations et les entreprises à créer des collections numériques et a ainsi eu l'occasion de travailler avec des organisations à but non lucratif, des collèges, des universités et des gouvernements. Les chercheurs peuvent rechercher quelques-unes des différentes archives du site, telles que les sites Web de la course aux candidats au Congrès de 2014, les archives de l'État de l'Alabama et les archives Web PLN d'informations du gouvernement canadien. Ce site est un trésor d'informations pour les journalistes entreprenants.
181. Communs civiques
Civic Commons a une page qui répertorie les différentes initiatives gouvernementales en matière de données ouvertes. Cette liste consultable de ressources est organisée par pays, ville, région et mentionne même les ressources mises à disposition par les organisations intergouvernementales. Pour les journalistes, ce site représente un moyen plus rapide de découvrir quels gouvernements participent au projet Open Data. Ce site donne également accès à des éléments de données localisés qui n'apparaîtraient pas nécessairement lors d'une simple recherche Google.
182. Gouvernements mondiaux gardiens
The Guardian est un nom célèbre dans le monde du journalisme pour sa réputation d'actualité. Ce que les gens réalisent moins, c'est que le site comporte une section qui propose des données sur les gouvernements du monde entier. Il existe des articles sur l'impact du nombre de sans-abrisme, des discussions sur la cybersécurité et même des discussions approfondies sur le rôle que les données et les statistiques doivent jouer dans le climat politique et social actuel. La section Gouvernement Mondial du Guardian est capable de relancer la discussion et de trouver des angles pour les histoires.
183. Données gouvernementales ouvertes (Hub)
Ce site appartient à un groupe via l'Open Knowledge Foundation dont le but est d'encourager et de soutenir le développement continu des données gouvernementales ouvertes. Ici, les utilisateurs découvriront des liens vers l’une des listes les plus complètes de catalogues de données ouvertes disponibles. Parmi les objectifs supplémentaires mentionnés sur le site, le groupe cherche également à trouver des informations sur les politiques, les meilleures pratiques et les lignes directrices. Il offre aux journalistes un accès étendu à des informations plus nombreuses et de meilleure qualité.
184. Gouvernement Ouvert – France
Ce site Web est la maison en ligne du projet de données ouvertes proposé par le gouvernement français. Il est possible d'explorer les données en effectuant une recherche dans des catégories telles que l'emploi, l'agriculture, l'éducation, les voyages et le tourisme. Il s’agit de données qui permettent de construire et de développer une compréhension plus nuancée de ce que disent réellement les données tout en laissant place à des comparaisons basées sur les informations historiques. Au fond, les journalistes ont toutes les raisons d’être enthousiastes à l’idée d’examiner ces données.
Ce site stocke les données de recherche disponibles grâce à l'utilisation de SourceForge.net par l'Université de Notre Dame. Les données sont proposées via des bases de données relationnelles. Les dumps de données mensuels permettent également de mieux comprendre les logiciels open source et leurs applications. Afin d'accéder à ces informations, les demandes d'accès doivent être faites par écrit par courrier électronique. Le problème, cependant, est que les chercheurs universitaires et universitaires sont les seuls à pouvoir accéder aux données.
186. Rapports d'OVNIS
Le National UFO Reporting Center dispose d'une base de données en ligne détaillant les expériences des personnes avec des objets volants non identifiés. Les chercheurs peuvent rationaliser leur recherche dans la base de données en utilisant l’une des quatre catégories suivantes : date, forme de l’OVNI, date de publication et même par état. Les ovnis sont uniques car ils ne manquent jamais de captiver l'imagination du public. S’il y a eu récemment des rencontres du troisième type à proximité, c’est l’endroit idéal pour découvrir ce que les gens ont dit.
187. WikiLeaks
Célèbre et infâme dans les médias en raison des controverses et de ce que les fuites ont révélé sur le fonctionnement interne du gouvernement et d'autres personnalités célèbres et puissantes de la société, WikiLeaks a une réputation qui la précède. Bien que les données soient rarement abandonnées en silence, personne ne remet jamais en question l’exactitude des informations. Pour les journalistes à la recherche d’articles susceptibles de susciter instantanément l’intérêt, WikiLeaks est une source fiable. Au moins, ce sera une lecture intéressante.
188. Le Washington Post
Le journal est déjà connu comme une excellente source d'actualités et d'articles d'opinion, mais peu de gens savent que le Washington Post donne accès aux données brutes souvent mentionnées dans ses articles. Sur la page de données, les chercheurs peuvent trouver des données dans des catégories telles que l'éducation, le recensement, la santé et la sécurité, les transports et le développement, les bases de données historiques de la Coupe du monde et même des chiffres relatifs au gouvernement et à la politique. En termes simples, avoir accès à ces chiffres aide les gens à développer une compréhension plus concrète des enjeux de l’actualité.
189. Données climatiques
Les données climatiques sont un ensemble de données qui fournissent des informations complètes sur la température mondiale. Dans le format actuel, les utilisateurs peuvent voir toutes les informations climatiques importantes à travers les grilles tout en étant également en mesure de voir quelles sont les moyennes. Pour ceux qui recherchent les données complémentaires, il est également possible d'accéder aux mêmes informations pour les terres et les océans. Ces informations peuvent être téléchargées, mais pour des raisons de commodité, elles peuvent également être consultées directement sur le site.
Protein Structure est une source qui cherche à examiner comment les réseaux informatiques peuvent être utilisés en conjonction avec la biologie. La page héberge un référentiel avec des données accessibles via les liens fournis. La manière dont le site intègre plusieurs idées telles que l'analyse de modèles et la biologie exécutable dans la poursuite de cet objectif est particulièrement intéressante pour les membres de la communauté des chercheurs. Pour les journalistes, ce site vaut la peine d'être consulté pour observer les progrès et examiner les données.
191. Analysez les données d'enquête gratuitement
Avec l'aide de ce site, les utilisateurs peuvent suivre un cours d'analyse des données d'enquête sans avoir à payer pour ce privilège. Analysez les données d'enquête gratuitement avec sa table des matières détaillée, comprend des sections portant des titres tels que Cartes et Art de l'enquête – Maintenance pondérée, Équilibrage de la confidentialité des répondants avec la précision de l'estimation de la variance, Modèles d'équation structurelle (SEM) et Données d'enquête complexes. Le site propose un excellent rappel pour ceux qui prévoient de traiter davantage de données statistiques à l'avenir.
192. UCLA
Sur le site wiki de l'UCLA, les chercheurs trouveront un certain nombre d'ensembles de données disponibles à des fins de démonstration. Il existe de nombreuses données simulées et observées parmi lesquelles choisir. Grâce à ces ressources, il est possible d'utiliser cette ressource pour découvrir des données climatiques, des données démographiques, des données biomédicales, des données de neuroimagerie, des données de recensement américain, des données électorales et des données économiques, parmi de nombreuses autres catégories. En fin de compte, ces ensembles de données constituent une ressource dont de nombreuses personnes peuvent bénéficier.
Sur la page de son site, l'Université de Toronto offre aux chercheurs l'accès à ce qu'elle appelle les ensembles de données Delve. Ces collections de données faisaient partie d'un produit plus vaste conçu dans le but de faire des comparaisons entre les méthodes d'apprentissage. En fin de compte, ces informations sont là pour le développement et l’évaluation des différentes approches d’apprentissage. En bref, il s'agit d'une source solide pour les chercheurs qui souhaitent mieux comprendre comment analyser et gérer des ensembles de données.
194. Service de conservation des ressources naturelles
Le Natural Resources Conservation Service dispose d'un site qui se concentre sur la promotion de la conservation tout en offrant des informations sur les différentes mousses, hornworts, plantes vasculaires, lichens et hépatiques présentes aux États-Unis. Ce site héberge une base de données complète de plantes et d'images de plantes qui peuvent être trouvées sur le site pour accompagner des tonnes d'informations. Les chercheurs peuvent télécharger la base de données et trouver des tonnes d’informations sur des sujets tels que les cultures alternatives. Essentiellement, ce site Web contient tout ce que les gens doivent savoir sur les plantes.
195. Service de recherche agricole
Comme le laisse supposer le nom de l'agence, ce service répond aux besoins de recherche du ministère américain de l'Agriculture. Chaque fois qu’un problème agricole est découvert, c’est la partie du gouvernement qui a probablement aidé à trouver une solution. Le site héberge un certain nombre d’ensembles de données accessibles et téléchargeables directement. Les journalistes peuvent également utiliser ce site pour trouver toutes les dernières nouvelles en lien avec les enjeux touchant l'agriculture.
196. Bibliothèque d'images cellulaires
Ce site propose une bibliothèque publique qui propose des ressources, des informations et un accès à des images et des animations représentant des cellules et des processus cellulaires. La cellule est conçue en gardant à l’esprit le double processus de recherche et d’éducation, les informations ici sont presque toujours pertinentes lors des discussions sur la santé publique et la maladie. Les matériaux proviennent d'une combinaison de sources, notamment de publications historiques et modernes. Pour une explication approfondie qui simplifie les processus biologiques complexes, les journalistes ne peuvent pas se tromper avec la bibliothèque d'images cellulaires.
197. Génomique complète
Il s'agit du site d'une entreprise qui se considère comme une partie établie de l'espace biotechnologique dans le domaine du séquençage du génome humain. Il est intéressant de noter que Complete Genomics a mis à la disposition du public un certain nombre de séquences complètes de son génome. En fin de compte, cela offre toutes sortes d’informations utiles sur l’ADN et le génome humain séquencé. La seule condition sur ce matériel est que les chercheurs qui utilisent ces informations prennent soin de donner à Complete Genomics les références appropriées.
198. Tableau Express
Array Express est un référentiel qui stocke les informations issues des résultats d'expériences génomiques nécessitant d'énormes quantités de séquençage ou de traitement. Sur ce site, les utilisateurs trouveront les résultats de plus de 70 000 expériences ainsi que plus de 2 millions d'essais dans plusieurs téraoctets de magasins de données. Mieux encore, ces informations sont gratuites et peuvent être réutilisées à des fins de recherche. Il s'agit d'une excellente ressource pour toutes les dernières informations sur la génomique et les progrès réalisés dans ce domaine.
199. Encoder
L'Encyclopédie des éléments d'ADN, ou Consortium ENCODE, est le résultat de groupes de recherche du monde entier qui travaillent en collaboration les uns avec les autres. En fin de compte, l’objectif est de dresser une liste de toutes les parties fonctionnelles du génome, incluant un examen attentif des niveaux d’ARN, des protéines, des éléments qui régulent les cellules et de l’activité des gènes. Il existe des données qui peuvent être recherchées ainsi qu'une encyclopédie qui offre des informations supplémentaires.
200. Ensemble Génomes
Ensemble Genomes est un site créé en 2000 qui traite du génome des vertébrés. Au fil des années, cette ressource a ajouté des informations complémentaires sur les métazoaires invertébrés, les plantes, les bactéries et les champignons. Les données sur tous ces sujets peuvent être trouvées et accessibles en cliquant sur les liens disponibles sur le site. Ce site propose des didacticiels, des ensembles de données sur tous les sujets abordés et une collection de documents à parcourir. Tous ces facteurs font d’Ensemble Genomes une source de données fantastique pour les journalistes.
201. Consortium d'ontologie génétique
Gene Ontology est un site qui existe dans le but exprès de trouver un moyen de représenter la compréhension actuelle du fonctionnement des gènes par ordinateur. Il contient de nombreuses publications ainsi que de la documentation supplémentaire que les gens peuvent lire. Il y a des annotations hébergées directement sur le site. La bonne nouvelle pour les chercheurs qui souhaitent examiner de plus près les chiffres et les données brutes est qu’il existe des fichiers disponibles en téléchargement directement sur le site Web.
202. Bibliothèque de signatures cellulaires basées sur un réseau intégré
Le centre LINCS de la Harvard Medical School existe dans le but d'aider la communauté des chercheurs et le grand public à en apprendre davantage sur la façon dont les cellules humaines réagissent lorsqu'elles ont été perturbées par des médicaments. Grâce à la base de données HMS LINCS et à l'outil d'exploration de projets, les chercheurs peuvent trouver des publications et des résumés de projets ainsi que des ressources générales. Les journalistes peuvent également utiliser ce site pour se tenir au courant de toutes les dernières nouvelles et informations issues de cette recherche.
203. Projet sur la diversité du génome humain
Le projet sur la diversité du génome humain a réalisé de nombreux progrès grâce aux efforts du Stanford Human Genome Center. Le site propose des échantillons contenant des milliers d’échantillons et de marqueurs. Il s’avère que ceux-ci peuvent être téléchargés, observés et analysés en profondeur simplement en suivant les liens fournis sur la page. Il s'agit d'une excellente ressource pour les journalistes qui souhaitent comprendre les informations provenant de la communauté des chercheurs.
204. Visualiseur de données JCB
JCB DataViewer permet aux personnes intéressées par ce que le Journal of Cell Biology a à dire de voir les données d'images associées aux articles qui y sont publiés. Le site dispose d'une galerie complète que les gens peuvent parcourir pour voir les documents. En outre, les téléspectateurs ont également la possibilité de procéder à une analyse plus approfondie des données au fur et à mesure qu'ils parcourent le site. En termes simples, ce site est parfait pour comprendre les références et les chiffres présents dans les articles de la revue.
205. Portail de données Genomic Data Commons
Le portail de données GDC est une plate-forme conçue pour aider les chercheurs et les acteurs du domaine de la bioinformation à effectuer plus efficacement des recherches sur le cancer. Il existe une archive, une API, ainsi que des documents disponibles en lecture, etc. Accéder à ce site signifie pouvoir consulter les mêmes informations que celles que les chercheurs en cancérologie utilisent pour mener leurs propres recherches. Ici, les journalistes pourront trouver toutes les données qu'ils recherchent et plus encore.
206. Ouvrirsp
L'Opensp est un projet communautaire conçu dans le but de partager des génotypes. Les personnes qui ont été saisies à l'aide de FamilyTreeDNA, 23andMe ou deCODEme peuvent télécharger ces informations sur le site. Le but de demander aux gens de le faire est que le site puisse se concentrer sur la recherche de liens pouvant être trouvés entre les génotypes et les SNP, ou entre les polymorphismes d'un seul nucléotide. Ce qui intéresse particulièrement les journalistes, c'est qu'il existe des données que les gens peuvent télécharger et consulter.
207. Guide de chemin
Pathguide est un site dédié à fournir des informations sur les voies métaboliques et de signalisation ainsi que sur les interactions entre les protéines au niveau moléculaire. Cette page héberge une liste d'environ 697 ressources liées au sujet principal. Les bases de données liées sur ce site sont généralement d'accès libre. La plupart des références fournies dans cette liste de ressources se concentrent principalement sur les interactions protéine-protéine. Ce site est une ressource inestimable pour les passionnés de biologie.
208. RCSB PBB
Il s'agit d'un site dédié à informer les universitaires et le grand public sur tout ce qui concerne les acides nucléiques et les protéines. La banque de données sur les protéines RCSB offre l'accès à divers outils conçus pour rendre cet aspect de la biologie plus compréhensible, notamment des outils de visualisation, une visualisation de structure 3D et une archive entièrement consultable qui peut être classée par catégorie d'organisme. De plus, ce site propose des informations mises à jour sur tous les derniers développements dans ce domaine.
209. Consortium de génomique psychiatrique
Le Consortium de génomique psychiatrique est le résultat d'une collaboration entre des chercheurs et des scientifiques du monde entier qui travaillent sur des recherches concernant la composante génétique des troubles psychiatriques. En fin de compte, ce projet a pu produire 17 articles principaux et 31 articles de développement supplémentaires proposant une analyse et une méthode secondaires avec un seul article historique issu de tout cela. Le Consortium propose des outils, des téléchargements et un accès aux résultats via le portail d'accès aux données sur demande.
210. Pub Chem
PubChem est un nom respecté dans le domaine de la recherche médicale et biologique, et ce depuis très longtemps. Offrant la possibilité de rechercher des structures ainsi que des bases de données de composés, de bioessais et de substances, les chercheurs ne peuvent pas se tromper avec ce site. De plus, des millions d’entrées sont présentes dans chacune de ces bases de données. Ces informations peuvent être consultées via des outils tels que les outils de conformation 3D et les outils BioAssay. Les données sont également disponibles en téléchargement.
211. COSMIQUE
Comme son nom l’indique, le Catalogue des mutations somatiques du cancer, ou COSMIC, est dédié à la chronique et à l’exploration des effets des mutations somatiques du cancer. Le site permet de rechercher COSMIC classé par type de cancer, gène et mutation. Il existe des outils sur COSMIC tels que le navigateur génome et le navigateur cancer. En outre, des données sur la curation des gènes, la résistance aux médicaments, les criblages du génome, les signatures mutationnelles et la curation de la fusion de gènes sont également disponibles en téléchargement sur le site.
212. Génomique de la sensibilité aux médicaments dans le cancer
L'étude Genomics of Drug Sensitivity in Cancer se consacre à la recherche de biomarqueurs pouvant aider les médecins à identifier le type de médicament anticancéreux auquel les patients sont plus susceptibles de répondre. Les journalistes peuvent utiliser les onglets d'actualité pour rester informés de la présence de nouvelles données ou des modifications apportées au site. En outre, il existe également une compilation de données sur les lignées cellulaires, une base de données relatant les caractéristiques du cancer et même une liste de composés, tous disponibles pour consultation sur le site.
213. Institut Stowers de recherche médicale
Le site Web du Stowers Institute for Medical Research offre au public chercheur un accès gratuit aux données que ses scientifiques, chercheurs et scientifiques en génomique ont utilisées pour leurs publications. Pour le grand public, l’institut prend soin de souligner que l’accès au Stowers Original Data Repository est généralement gratuit. Cela étant dit, certains des fichiers les plus volumineux de la base de données peuvent ne pas être accessibles directement via Internet et peuvent nécessiter des dispositions supplémentaires.
214. Base de données SSBD
La base de données système Science of Biological Dynamics, généralement appelée base de données SSBD, fournit une suite d'outils et de ressources à utiliser dans le but d'examiner des images microscopiques et d'évaluer des données biologiques quantitatives. Les images trouvées sur ce site proviennent de diverses sources et incluent des objets tels que des cellules, des molécules uniques et des noyaux d'expression génétique. Les données de ce site étant acquises à partir de simulations informatiques et d'expériences, les journalistes peuvent être assurés que les informations ici sont constamment affinées et mises à jour.
215. Partager des génomes personnels
Le Personal Genome Project est un site axé sur la création de données sur la santé, le génome et les caractéristiques ouvertes et accessibles au public. Poursuivant en grande partie le projet avec l'aide d'individus qui se sont portés volontaires pour rendre publiques leurs informations génomiques, ce site offre gratuitement au public les données qu'il a trouvées et acquises avec succès. La science mise à part, ce projet offre aux journalistes un regard intéressant sur les effets de la création d'un dossier public d'informations sur le génome personnel.
216. Navigateur de génome UCSC
Le navigateur de génome USCS permet aux individus de visualiser les assemblages de génomes. En plus de la visualisation en ligne, le site propose également des liens pouvant être utilisés pour télécharger les séquences et les annotations de ces mêmes assemblages de génomes. Ces liens sont divisés en catégories : humains, mammifères, autres vertébrés, deutérostomes, insectes, nématodes, autres génomes et autres téléchargements. Les outils et répertoires de ce site sont également gratuits pour un usage personnel et non commercial. Les journalistes peuvent bénéficier de l’exhaustivité et de l’accessibilité de ces informations.
217. UniProt
L'Universal Protein Resource, connue sous le nom d'UniProt, est l'endroit où aller pour obtenir des informations sur le séquençage et l'annotation des protéines. S'appuyant sur les informations fournies par trois bases de données dans les clusters de référence UniProt, la base de connaissances UniProt et les archives UniProt, ce site est équipé, entre autres fonctionnalités, de recherches de peptides et de clusters. Les journalistes peuvent utiliser ce site pour vérifier, découvrir et en savoir plus sur les nouvelles découvertes dans le domaine du séquençage et de l'annotation des protéines.
218. Données de l’indice climatique des actuaires
L'Indice actuariel climatique, également appelé ACI, fournit au grand public et aux décideurs des informations sur les tendances climatiques et les effets des changements climatiques au Canada et aux États-Unis. Les chercheurs peuvent parcourir les informations fournies par cet outil pédagogique pour trouver et découvrir des changements massifs dans la mer et la météo. Il est possible de restreindre la recherche par régions et composants. Ce site dispose de plusieurs décennies de données et met régulièrement à jour ses informations tous les trimestres.
219. Centre de météorologie aéronautique
Le Centre météorologique pour l’aviation fournit des informations météorologiques précises, actuelles et à jour sur lesquelles le système de l’espace aérien peut s’appuyer. Sur ce site, les utilisateurs peuvent visualiser les différents graphiques, prévisions et observations météorologiques structurés de manière à ce que les aviateurs puissent les apprécier. Il est possible de visualiser les informations fournies par les sources de données du site en temps réel via une sortie .csv ou XML. Les chercheurs peuvent manipuler et observer les chiffres bruts de plus près grâce à cette option de téléchargement.
220. Unité de Recherche Climatique
Le site Web de l'Unité de recherche climatique a pour but exprès d'effectuer des recherches sur les effets du changement climatique dans le passé, d'étudier les causes et de trouver des solutions aux problèmes du changement climatique dans le présent. Ici, les gens peuvent prendre connaissance des résultats de la recherche, avoir un aperçu du sujet grâce aux fiches d'information, lire des publications et même accéder aux données brutes. Les journalistes à la recherche d’ensembles de données météorologiques brutes ont de la chance avec cette ressource.
221. Évaluation et ensemble de données climatiques européens
Sur le site Internet de l'European Climate Assessment & Dataset, le public peut découvrir des informations sur les changements extrêmes du climat ou de la météo. Les chercheurs ont la possibilité d'utiliser l'outil de recherche du projet, appelé KNMI Climate Explorer, pour vérifier les données, examiner les prévisions saisonnières et même examiner de plus près les effets d'El Niño, entre autres applications. Puisque cet ensemble de données est mis à jour quotidiennement, les journalistes utilisant cette source seront les premiers informés de tout signe de changement climatique extrême.
222. Services de navigation d’images globales
Global Imagery Browse Services, GIBS en abrégé, est un élément essentiel d'EOSDIS dans son rôle de fournisseur de services d'imagerie réactifs et basés sur les normes communautaires. En d’autres termes, GIBS permet aux gens ordinaires d’interagir avec des images satellite prises de pratiquement n’importe où sur terre en haute définition. Depuis qu'EOSDIS GIBS est rendu disponible via les données scientifiques de la Terre de la NASA, il est plus facile que jamais pour les journalistes et les chercheurs d'en apprendre davantage sur le monde en temps réel.
223. Climat et écosystème de Béring
Opérant sous l'égide de la National Oceanic and Atmospheric Administration du gouvernement des États-Unis, ce site Web raconte aux journalistes et aux chercheurs tout ce qu'ils peuvent vouloir savoir sur la façon dont le climat et l'écosystème de la mer de Béring réagissent aux changements survenus dans l'Arctique. Ici, il est possible de lire des essais, de revoir des projections et d'utiliser l'outil de données en ligne pour voir l'évolution de divers indices climatiques, de données biologiques, atmosphériques, océaniques et de la faune dans la mer de Béring.
224. NCEI
Le NCEI, ou Centres nationaux d'information sur l'environnement, est le résultat final de la fusion des trois centres de données de la National Oceanic and Atmospheric Administration. Cette page héberge une série de liens divisés en 22 catégories qui relieront les utilisateurs à différentes ressources, pages d'intérêt et ensembles de données climatiques et météorologiques. Les journalistes à la recherche d'informations sur le climat, les tempêtes, les précipitations et une foule d'autres problèmes météorologiques trouveront probablement ici ce qu'ils cherchent.
225. Laboratoire de recherche sur le système terrestre
La division de surveillance mondiale de la National Oceanic and Atmospheric Administration fournit des informations sur les tendances à long terme des forces du changement climatique sur terre grâce à sa surveillance de paramètres atmosphériques clés. Parmi ceux-ci figurent par exemple le monoxyde de carbone, le méthane, l’oxyde nitreux et le dioxyde de carbone. Ces mesures sont ensuite utilisées pour mesurer des éléments tels que l’appauvrissement à long terme de la couche d’ozone, les sources et niveaux de dioxyde de carbone, ainsi que les puits. Il s’agit d’une ressource sur le changement climatique que les journalistes peuvent utiliser.
226. WorldClim – Données climatiques mondiales
Vous avez toujours voulu une meilleure façon de visualiser les données climatiques ? WorldClim est un fournisseur de logiciels de données gratuites pouvant ensuite être appliquées à la modélisation spatiale ainsi qu'à la création de cartes. La version actuelle de ce logiciel gratuit ne peut être appliquée qu'au climat actuel tandis que l'ancienne version permet d'accéder aux données climatiques du passé et du présent et permet également aux utilisateurs de voir l'état des prévisions climatiques futures. Les journalistes peuvent simplement suivre le lien et télécharger le logiciel.
227. Laboratoire de découverte des connaissances
Le Knowledge Discovery Laboratory est un site dédié au développement de technologies innovantes, aux bases de l'apprentissage automatique et à l'application de ces connaissances dans des domaines pratiques tels que la science des réseaux, la détection de fraude et l'analyse de données scientifiques. Le site héberge un ensemble de données assez important dans le DBLP avec 1,2 million d'objets et 2,48 millions de liens inclus dans l'ensemble. Pour les chercheurs intéressés par les objectifs du Knowledge Discovery Laboratory, cet ensemble de données constitue une excellente ressource.
228. Défi de mise en œuvre de DIMACS
Le site Web du 9e Implementation Challenge a pour objectif d'aider les chercheurs à apprendre à résoudre les problèmes du chemin le plus court. Pour les créateurs, le site a été construit avec deux objectifs en tête. Premièrement, trouver les meilleures solutions reproductibles. Et deuxièmement, permettre aux chercheurs de collaborer facilement et de découvrir des solutions plus efficaces. Les chercheurs qui souhaitent voir les progrès réalisés dans ce domaine peuvent consulter les articles et les ensembles de données sur le site.
229. Référentiel réseau
Le Network Repository est un site où les données scientifiques sont stockées avec l'ajout d'outils visuels interactifs auxquels les utilisateurs peuvent accéder et analyser. Ce site a la double distinction d'être à la fois le premier référentiel de ce type et également le plus grand du Web. En utilisant des données graphiques et des images intuitives et visuellement attrayantes, il est beaucoup plus facile d'effectuer des comparaisons et de trouver de nouvelles façons de contextualiser les données. Les journalistes peuvent utiliser cette source pour trouver des articles parmi les données scientifiques.
230. Ensembles de données Pajek
Pajek Datasets est une page qui fournit un ensemble de données qui traite des interactions entre les protéines trouvées dans la levure en herbe. Après avoir offert une brève explication générale sur l'impact de la recherche de nouvelles méthodes de détection des interactions ainsi que sur les raisons pour lesquelles il est essentiel de pouvoir discerner l'importance de diverses interactions protéine-protéine, le site relie directement les téléspectateurs à un ensemble de données disponible en téléchargement. Pour en savoir plus, les chercheurs peuvent cliquer sur le lien en bas afin de lire l'article publié sur le sujet.
Ce site cherche à partager des liens vers les ensembles de données réseau que le propriétaire du site Web a utilisés et compilés. Les thèmes des ensembles de données vont du football universitaire américain, des blogs politiques et des livres sur la politique américaine, aux réseaux sociaux, aux Misérables et aux collaborations théoriques à haute énergie. Les personnes souhaitant les explorer auront le choix entre de nombreux thèmes d’ensembles de données intéressants. De plus, les données sont libres d’utilisation tant qu’il y a des références.
232. La base graphique de Stanford
Stanford GraphBase est le nom donné à un ensemble d'ensembles de données et de programmes par Donald Knuth de Stanford. Lorsqu'ils sont utilisés en combinaison les uns avec les autres, ces programmes et ensembles de données sont capables de manipuler et de générer des graphiques et des réseaux. Sur ce site, le matériel requis est disponible en téléchargement via les liens. Dans ces fichiers, les chercheurs trouveront des données sur les scores de football, des données de dictionnaire, des données concernant la reconstruction de la Joconde et bien d'autres.
233. Collection SuiteSparse Matrix
Anciennement connue sous le nom de Sparse Matrix Collection de l'Université de Floride, la SuiteSparse Matrix Collection est une collection de matrices qui ont des implications réelles. Selon le site, cette collection particulière est utilisée le plus souvent pour l'algèbre linéaire numérique dans le développement et le raffinement d'algorithmes à matrice clairsemée. Les utilisateurs ont tendance à apprécier la collection pour son utilité pour exécuter et tester les résultats d’expériences. Les jeux de données et les benchmarks matriciels sont disponibles en téléchargement directement sur le site.
234. Ensembles de données graphiques
Il s'agit d'un ensemble d'ensembles de données que les créateurs de cette page Web pensaient être soit relationnels, soit capables de bien se traduire en représentation graphique. Graph Datasets propose des ensembles de données tels que les données du Predictive Toxicology Challenge, les données IMDb, les données de mutagenèse, les données MovieLens, le filtrage collaboratif et les données sur les protéines aux chercheurs qui souhaitent apprendre à travailler avec les chiffres bruts. Les fichiers sont mis à disposition sur cette page et sont principalement disponibles en téléchargement au format XML.
235. Actualités sur les mégadonnées
Big Data News est un site axé sur le Big Data et les principes fondamentaux de la science des données. Ce site héberge les dernières nouvelles et comprend des discussions sur l'apprentissage profond et l'intelligence artificielle. En outre, Big Data News héberge également un ensemble de données massif contenant au total environ 3,5 milliards de pages Web. Ceux-ci sont tous séparés par des niveaux appelés respectivement graphique au niveau de la page, graphique au niveau du sous-domaine, graphique du sous-domaine de premier niveau et graphique du domaine du niveau de rémunération.
236. Centre de recherche sur les réseaux et systèmes complexes
CNetS, ou Centre de recherche sur les réseaux et systèmes complexes, opérant sous l'égide de l'Indiana University Network Science Institute et de la School of Informatics and Computing. Le site est destiné à être une ressource dans les domaines de la science des données, des sciences sociales informatiques et des réseaux et systèmes complexes contenant des informations sur l'exploitation minière et les modèles de trafic en ligne. En outre, CNetS héberge également un ensemble de données contenant environ 53,5 milliards de requêtes réseau effectuées par les utilisateurs de l'Université d'Indiana.
237. Explorateur OONI
OONI Explorer, qui fait partie de l'Open Observatory of Network Interference, est un projet dédié à la fourniture de logiciels gratuits et open source. Il est possible pour les utilisateurs d'utiliser ensuite le logiciel pour tenter de bloquer des sites Web et des applications de messagerie, entre autres applications. Ce qui est particulièrement intéressant pour les personnes intéressées par cette technologie, c'est la disponibilité d'un accès gratuit aux données brutes collectées par OONI. Entrez simplement les informations dans OONI Explorer et interagissez avec les données à partir de là.
238. Les défis de l'apprentissage automatique
Challenges in Machine Learning est dédié à la recherche et au développement de l’apprentissage automatique. Sur ce site, les lecteurs trouveront des liens vers des logiciels, des livres, des défis d'apprentissage automatique, ainsi que des notifications d'ateliers à venir. Le site fournit même des liens vers des défis qui permettent des soumissions post-date. Pour les journalistes qui souhaitent voir si l'apprentissage automatique peut effectuer des tâches telles que des prévisions financières ou la classification de pages Web, c'est un site qui mérite une visite.
239. DonnéesX
Travaillant actuellement sous l'égide de CrowdANALYTIX, DataX fait partie d'une initiative communautaire qui exploite la puissance du collectif pour créer des applications personnalisées d'intelligence artificielle, d'apprentissage automatique et de programmation neurolinguistique. Le rôle de DataX dans le processus est la maintenance et le déploiement qui, à leur tour, servent à rendre ces solutions évolutives. Pour les journalistes qui ont des tonnes de textes, de vidéos et de données à trier, les robots disponibles via CrowdANALYTIX et DataX peuvent réduire de moitié les temps de recherche.
240. Données pilotées
Driven Data combine le crowdsourcing et la science des données d'une manière que presque aucun autre site ne fait. Soulignant son rôle d'assistance aux organisations qui s'attaquent à différents défis sociaux, ce site propose son aide en mettant son importante communauté de science des données au travail pour créer des modèles statistiques qui résolvent des questions prédictives. Driven Data semble fonctionner principalement avec des organisations à but non lucratif, mais il est potentiellement utile à toute personne disposant de données brutes à affiner. Les journalistes peuvent gagner à garder cette source à l’esprit.
241. Ouvrir le Big Data
L'API Dandelion est une application qui gère l'analyse sémantique de texte pour le Big Data. Ce que cela signifie pour les personnes disposant de données à traiter, c'est que ce programme prendra du texte désorganisé et trouvera un moyen de le mettre en contexte. Les journalistes qui analysent de nombreux documents peuvent certainement bénéficier de cette fonctionnalité. L'API Dandelion propose également du Big Data ouvert dans les catégories Milan, Trente et Europe. Bien que cette API soit payante, une quantité quotidienne de texte peut être analysée gratuitement.
242. Modèles terrestres
Earth Models se concentre sur le partage et le stockage de logiciels et d'ensembles de données liés à la Terre. Les outils de modélisation mentionnés sur le site comprennent des logiciels et des traitements de simulation ainsi que des données virtuelles qui empruntent largement à des domaines d'études spécifiques comme la tectonique et la sismologie. Les journalistes et chercheurs qui souhaitent affiner leurs connaissances sur le sujet peuvent pour cela s'appuyer sur les publications et articles de ce site avant de se lancer dans les outils de modélisation et de visualisation.
243. Centre de données et d'applications socioéconomiques (SEDAC)
Le Centre de données et d'applications socioéconomiques, ou SEDAC, est l'un des centres de données associés au système EOSDIS de la NASA. Sur ce site, les lecteurs trouveront des ensembles de données proposant des chiffres sur le changement climatique ou des informations démographiques maillées. Les ensembles de données peuvent également être recherchés par thèmes tels que la gouvernance, l'agriculture, l'utilisation des terres, la santé, la conservation et le climat, l'eau, la télédétection et la pauvreté. Il existe des cartes, des galeries, des guides qui donnent plus de contexte aux données, ainsi que des ressources et des outils supplémentaires auxquels les chercheurs peuvent également accéder sur le site.
244. Portail AODN
Le portail AODN, un site détenu par l'Australian Ocean Data Network, est un site qui offre un accès aux données australiennes sur la science climatique et marine. Les chercheurs qui accèdent à ces informations auront également accès aux données et aux métadonnées de l'IMOS, qui constituent un cadre de recherche de plusieurs institutions, notamment avec le soutien du gouvernement australien. Les chercheurs qui choisissent d'exploiter le portail AODN peuvent s'attendre à recevoir une excellente livraison de données océaniques dans une interface intuitive.
245. Planète OS
Planet OS propose un cadre Big Data mettant l'accent sur les énergies renouvelables. Ce choix de niche couplé à la compétence du site l'a rendu populaire auprès des entreprises énergétiques à la recherche de nouvelles façons de visualiser et de contextualiser leurs données. De plus, le site dispose également de ce qu'on appelle le DataHub, où il héberge une collection substantielle de plus de 2 000 ensembles de données. Ces ensembles de données comprennent des données ouvertes via la NASA et Copernicus et les données sont souvent mises à jour régulièrement.
Le Smithsonian est depuis longtemps un nom universitaire respecté et apprécié dans le monde entier pour son engagement envers la recherche et l'histoire. À certains égards, il est tout à fait naturel que le Smithsonian dispose d'un site Web offrant certaines des meilleures informations en ligne sur la recherche sur les volcans. Le site publie des rapports, des liens de recherche et des bases de données qui incluent des recherches rétrécies sur les volcans, les éruptions, les émissions et les déformations pour accompagner la liste et la feuille de calcul des volcans de l'Holocène. Les journalistes n'auront pas besoin d'une autre source sur l'activité volcanique.
247. Catalogue des tremblements de terre
Mis à jour et maintenu par le programme des risques sismiques du gouvernement américain, le catalogue des tremblements de terre permet aux chercheurs de voir quand et où un tremblement de terre s'est produit pour la dernière fois. Bien que les résultats de recherche soient limités à 20 000, la recherche dans le catalogue est capable de filtrer les résultats par ampleur, date et heure, et même par région géographique. Ce niveau de flexibilité rend cette ressource particulièrement utile pour les journalistes qui couvrent une catastrophe naturelle ou un tremblement de terre local et recherchent des informations générales.
248. Association économique américaine
L’American Economic Association fournit aux chercheurs des données macroéconomiques pour les États-Unis et d’autres pays du monde. Ce site ne semble pas tant produire de données économiques qu'il dresse une courte liste des plus fiables. Cependant, au vu des nombreux sites proposant des informations économiques sur Internet, il s'agit d'une ressource à laquelle les journalistes peuvent s'attendre à avoir de la crédibilité. Allez simplement sur le site et cliquez sur les catégories de données économiques en conséquence.
249. Statistiqueshistoriques.org
Historicalstatistics.org est un site incroyablement utile pour trouver le type d’informations économiques qui présentent un contraste intéressant avec le présent. Par exemple, le convertisseur de devises historique du site permet aux chercheurs de savoir combien une personne disposant de 10 dollars américains en 1923 pouvait acheter aujourd'hui. Il héberge également des publications et des articles qui posent des questions sur les mesures utilisées dans le domaine de l'histoire économique ainsi que des indices de prix et des informations sur la masse monétaire qui peuvent être filtrées par pays.
250. DB Nomiques
Et si toutes les données économiques publiques sur Internet pouvaient être consultées et recherchées à partir d’une seule plateforme navigable ? Db.nomics est un agrégateur de bases de données économiques qui cherche à faire exactement cela. Les données sont disponibles dans des formats tels que HTML, JSON et CSV et sont automatiquement mises à jour tandis que les révisions précédentes sont archivées en conséquence. Les sources économiques comprennent la Réserve fédérale, le Bureau of Economic Analysis, le Fonds monétaire international et d'autres. Les chercheurs à la recherche de données économiques fiables ne peuvent pas se tromper avec Db.nomics.
251. Plateforme conjointe de la dette extérieure (JEDH)
Développé grâce au travail combiné de la Banque des règlements internationaux, de l'Organisation de coopération et de développement économiques (OCDE), du Fonds monétaire international et de la Banque mondiale, le Centre conjoint de la dette extérieure rend accessibles aux utilisateurs des informations sur les données sur la dette et les créanciers et débiteurs internationaux. le public. Les journalistes qui s’intéressent aux finances de différents pays et tentent de mieux comprendre le paysage financier international trouveront ici pratiquement tout ce qu’ils veulent savoir.
252. Données sur le commerce international
Réunie avec la contribution complète d'un expert économique de premier plan, Jon Haveman, cette page sur les données du commerce international héberge des données qui peuvent être téléchargées et analysées plus en détail. Les ensembles de données comprennent des données tarifaires, des tableaux Penn World, des services publics, des données sur les importations, la productivité manufacturière, les classifications des marchandises, les codes de différenciation des produits Rauch, les données du NBER, l'enquête sur les flux de matières premières de 1997, le commerce et l'immigration, ainsi que le modèle gravitationnel utile. UNIX est le système d'exploitation utilisé pour les compiler, mais le site indique que les PC devraient également avoir accès aux données.
253. Entreprises ouvertes
Sur OpenCorporates, les chercheurs ont le luxe de rechercher et de trouver des informations dans l'une des plus grandes bases de données ouvertes d'entreprises au monde. Ces informations sont ensuite utilisées par différents groupes à travers le monde, tels que des banques, des enquêteurs, des ONG et des journalistes, dans un effort de renseignement et d'information. Les journalistes ont l'avantage supplémentaire de pouvoir accéder aux données en temps réel à l'aide de l'API OpenCorproates ainsi que via les données de base en masse ou d'autres ensembles de données de base.
Our World in Data prend des informations provenant d'un certain nombre de sources dans divers domaines et présente des données quantifiées à ce sujet. Qu'il s'agisse de chiffres sur la participation des femmes au marché du travail ou d'informations sur la perception générale de la corruption dans le secteur public et sur l'inégalité mondiale des revenus, si le sujet peut être abordé en termes de données, ce site Web pourrait bien contenir une entrée à ce sujet. Les journalistes peuvent utiliser cette source pour trouver des statistiques et des chiffres liés aux questions sociales.
255. Science-Po
Sciences Po, ou comme on l'appelle plus communément, l'Institut d'études politiques est une école qui a une influence indéniable dans le domaine des sciences sociales. Dans ce cas, la page de Thierry Mayer comprend des fichiers de données qui présentent des données de régression sur la gravité et les conflits militaires de « Make Trade Not War », ainsi que des ensembles de données sur les potentiels du marché, entre autres. Les journalistes cherchant à mieux comprendre les conclusions tirées dans les revues universitaires découvriront de nombreuses informations en parcourant ce site.
256. Centre de données internationales
Depuis ses débuts en 1999, le Center for International Data se consacre à sa mission de collecte, de création, d'amélioration et de distribution de données économiques internationales hors ligne et en ligne. Sur le site Web, les lecteurs peuvent accéder à des informations telles que les données tarifaires américaines, les importations et exportations mondiales et américaines, et même des informations de la Penn World Table. Ces informations étant mises à la disposition du public à des fins d’éducation et de recherche, les journalistes peuvent accéder et utiliser ces données gratuitement.
257. Observatoire de la complexité économique
L'Observatoire de la complexité économique, communément appelé OEC, permet aux chercheurs, étudiants, économistes et à quiconque de visualiser les données du commerce international. Avec ses thèmes accrocheurs et son interface interactive, ce site offre aux chercheurs une opportunité légitime d'explorer les informations sur le commerce international d'une manière jamais vraiment vue auparavant. Pour les journalistes qui aiment voir les données économiques prendre vie au fur et à mesure de leur recherche, l’OEC est une ressource inestimable.
258. Données du tableau de bord des collèges
L'enseignement supérieur est un sujet brûlant dans de nombreux cercles, les étudiants et les familles souhaitant savoir comment les écoles se situent et dans quelle mesure les étudiants apprennent. Grâce à ses données College Scorecard, le ministère américain de l'Éducation fournit aux éducateurs et aux étudiants toutes ces informations et bien plus encore. Ces chiffres couvrent la période de 1996 à 2016 et comprennent les données actuelles, les données du tableau de bord, les revenus post-scolaires ainsi que les nouvelles informations du Système national de données sur les prêts étudiants. Il s'agit d'une source d'éducation postsecondaire à jour que les journalistes devraient s'assurer d'utiliser.
259. Ensemble de données sur l'énergie des bâtiments commerciaux
En tant qu’ensemble de données traitant principalement de l’énergie, COMBED revendique automatiquement son caractère unique. Ajoutez à cela le fait que ses données sont renouvelées plusieurs fois par minute alors qu'elles proviennent d'un immeuble commercial, et il devient clair que cet ensemble de données est unique en son genre. Pour les journalistes, ces informations sont incroyablement utiles lorsqu’elles préparent un article sur la consommation d’énergie. Accéder aux données de COMBED est aussi simple que de télécharger et d'ouvrir une feuille de calcul Excel.
260. Ensemble de données DRED
La partie DRED de la base de données DRED signifie Dutch Residential Energy Dataset. Comme le titre l'indique, ces données mesurent et étudient la quantité d'énergie qu'un seul ménage néerlandais consommera. L'ambiance, l'occupation, l'électricité et les informations générales sur les ménages ont toutes été surveillées dans cet ensemble de données du 5 juillet 2015 au 5 décembre 2015. Tout journaliste effectuant des recherches sur la consommation d'énergie gagnerait à consulter les chiffres bruts fournis ici. Les instructions pour télécharger les données au format CSV sont disponibles directement sur le site Web.
ECO, qui signifie Electricity Consumption and Occupancy, est un projet exploité et géré par le Distributed Systems Group. Le principe de ce projet a permis aux chercheurs de surveiller les charges et de détecter les occupations dans six ménages suisses pendant 8 mois. Ce site offre un accès à ces informations ainsi que des instructions et des liens vers des publications connexes. Grâce au tableau de bord visuellement interactif du site, les journalistes ne devraient avoir aucun problème à traduire la recherche en quelque chose d'engageant.
262. Ensemble de données indien sur l'eau ambiante et l'énergie
IAWE, qui signifie Indian Dataset for Ambient Water and Energy, a été créé dans le but de surveiller la consommation d'énergie d'une maison de New Dehli avec des mesures d'électricité provenant des appareils, du compteur électrique et du panneau de circuit. En raison de pannes, de différences dans l'approvisionnement en eau, de pertes de paquets et de fluctuations de tension, l'iAWE a rencontré des problèmes propres au suivi de la consommation d'énergie en Inde. Il s’agit de données extrêmement utiles pour les journalistes lorsqu’ils discutent des modèles de consommation d’énergie.
263. Électricité au niveau des appareils domestiques au Royaume-Uni
UK Domestic Appliance-Level Electricity, ou UK-DALE, est le nom donné à un ensemble de données qui surveille et enregistre la quantité d'électricité demandée dans un groupe de cinq ménages. Toutes les six secondes, UK-DALE mesure la demande du réseau électrique principal ainsi que des appareils individuels de la maison. Les journalistes intéressés par la manière dont les ménages britanniques utilisent l’énergie peuvent certainement utiliser UK-DALE. Les données sont accessibles et il existe un document décrivant le système disponible en lecture.
264. ArcGIS
ArcGIS Hub est une plate-forme que les organisations et les individus peuvent utiliser pour atteindre leurs objectifs grâce à des initiatives à l'échelle du site. Avec des modèles de pages, des guides étape par étape et des exemples disponibles, ce site est une excellente ressource pour les acteurs sociaux ambitieux. Pendant ce temps, les informations disponibles sous l’onglet Open Data hébergent des centaines d’ensembles de données dans la seule catégorie « Catastrophe ». Que les journalistes recherchent des données ou y contribuent, ArcGIS Hub est utile à plus d'un titre.
265. Cambridge SIG
Cambridge GIS est le référentiel de données ouvertes de la ville de Cambridge, dans le Massachusetts. À l'exception des fichiers trop volumineux pour être téléchargés via ce référentiel GitHub, la plupart des ensembles de données de la ville se trouvent sur cette page. Les ensembles de données individuels disponibles ici comprennent les districts commerciaux, les servitudes, les districts de zonage, les résultats du recensement, les cimetières et d'autres points de repère et caractéristiques qui peuvent être quantifiés par les données. Un journaliste à la recherche d'informations locales trouvera tout ce qu'il cherche et bien plus encore sur ce site.
266. Géo-Wiki.org
En tant que ressource, Geo-Wiki est un site dédié à ce qu'il appelle le « mouvement scientifique citoyen ». Ici, les citoyens sont encouragés à s'essayer à la surveillance de l'environnement. Les chercheurs peuvent trouver les dernières nouvelles dans la barre latérale ainsi que les noms des publications et des téléchargements gratuits d’ensembles de données et de logiciels. Les outils rendus accessibles par le site comprennent des cartes, des téléchargements de données personnelles, des validations et des hackathons téléchargeables au format Excel et dans des fichiers zip.
267. OuvrirStreetMap
Les extraits de données OpenStreetMap proviennent du projet OpenStreetMap, la tentative en ligne actuelle de créer une carte du monde grâce aux modifications et aux efforts de la communauté mondiale des utilisateurs. Pour démarrer avec cette source de données, il suffit aux éditeurs de contenu de choisir leur continent préféré, puis de trouver leur pays préféré par la suite. Il n'y a aucun frais pour le téléchargement de Geofabrik GmbH et les données sont mises à jour quotidiennement en règle générale.
Exploité et géré par le ministère de la Sécurité intérieure, HIFLD, pour Homeland Infrastructure Foundation-Level Data, place les données géospatiales dans le domaine public. Ces données sont diffusées dans le but exprès de fournir un soutien et des informations à des fins de recherche et de préparation dans la communauté. Ces données peuvent être téléchargées dans Shapefile et CSV et peuvent également être consultées sur le Web. Pour les éditeurs, HIFLD Open Data rend les données géospatiales plus visuelles et attrayantes que jamais.
269. Adresses ouvertes
OpenAddresses est spécialisé dans l'infrastructure et la collecte d'adresses. Alimenté en grande partie grâce aux efforts de la communauté, ce site utilise GitHub comme plateforme de développement. Ici, les gens peuvent placer des adresses sur une carte après l'avoir ajoutée à la base de données ou ils peuvent prendre les données et commencer immédiatement le géocodage. Avec toutes les données et adresses ouvertes et nécessitant une simple attribution, les mises à jour régulières des données et le potentiel d'avancées en matière de géocodage font d'OpenAddresses un projet très intéressant.
Open Data LMU s'appuie fortement sur les données d'OpenStreetMap pour aider au développement du Fast Reverse Geocoder. Cela signifie que l'application est capable de prendre rapidement un emplacement sur une carte et de trouver une adresse complète en fonction de ce point. Cela pourrait potentiellement s’appliquer également aux quartiers et aux comtés. Cette page Web héberge un ensemble de liens liés à l'application qui incluent le code source, les ensembles de données et les tables de recherche et résolutions OpenStreetMap.
271. Explorateur de données environnementales
Avec l'explorateur de données environnementales, les journalistes, les chercheurs et les étudiants peuvent télécharger et explorer les mêmes ensembles de données que le Programme des Nations Unies pour l'environnement utilise avec ses organisations affiliées et ses partenaires. Les recherches peuvent être restreintes par région et effectuées à l'aide de l'un ou de l'ensemble des 500 filtres. De plus, les ensembles de données comprennent des catégories telles que la santé, le PIB, le climat, les émissions et l'eau douce qui peuvent être visualisées directement sur le site sous forme de graphique, de tableau ou de carte.
272. Groupe de la Banque africaine de développement
Le site du Groupe de la Banque africaine de développement est le premier arrêt d'un journaliste lorsqu'il recherche des informations statistiques et des indicateurs relatifs au continent africain. Les utilisateurs qui parcourent le catalogue de données peuvent filtrer les ensembles de données par source, sujet et région. Pour tous ceux qui recherchent une connaissance plus approfondie du sujet traité, le site propose également des liens vers une liste impressionnante de publications comprenant des titres tels que les Perspectives économiques en Afrique et l'Annuaire statistique africain.
273. Données communes génomiques (GDC)
Genomic Data Commons du NCI héberge l'un des référentiels de données sur le cancer les plus complets sur le Web qui se concentre sur le domaine des études génomiques sur le cancer. Le portail de données de ce site héberge des milliers de cas et couvre 38 types de maladies pour aller avec 39 projets et est libre d'accès. Les soumissions de données étant principalement effectuées par des institutions et des chercheurs, l'exactitude de ces informations en fait une source de données idéale pour les journalistes.
274. Bases de données PhysioBank
Les bases de données PhysioBank mettent des données physiologiques à la disposition des individus via le domaine public. Ces bases de données sont divisées en deux grandes catégories en forme d'onde et clinique. Parmi les sous-catégories de formes d'onde, il y a des bases de données d'images, d'intervalles interbattements, synthétiques, de marche et d'équilibre, d'ECG et de bases de données multiparamètres. Un avant-goût des informations pures qui en découlent comprend des données sur les signes vitaux au chevet du patient, la saturation en oxygène et même les maladies cardiovasculaires. Les journalistes et les personnes faisant des recherches sur le corps humain peuvent trouver des informations ici.
275. Base de données sur la couverture de l'assurance-maladie
La base de données Medicare Coverage, gérée par les Centers for Medicare & Medicaid Services par l'intermédiaire du ministère de la Santé et des Services sociaux, offre aux chercheurs un accès complet à une tonne d'informations sur les services médicaux. Il existe des informations sur les maladies chroniques, les dépenses en médicaments, les modèles cliniques électroniques, le système de recouvrement de créances et les subventions de recherche et de démonstration à lire. Pour les données tirées directement de la source, il s'agit du site le plus complet et le plus complet de son genre en ligne.
Contenu de nos partenaires
276. Données de paiement ouvertes
Lorsque la plupart des gens vont chez le médecin, ils ne s'assoient généralement pas pour se demander si leur médecin de premier recours bénéficie ou non financièrement après avoir travaillé avec des fabricants de soins de santé. Open Payments informe le public de tous les repas, recherches, cadeaux, honoraires de conférencier et frais de déplacement que le médecin ou l'hôpital a reçus des entreprises. Les journalistes à la recherche d'une histoire percutante peuvent soit utiliser l'explorateur de données pour afficher les informations, soit cliquer sur l'onglet pour télécharger directement les données.
277. FlickrLogos
C'est partiellement écrit dans le nom, mais FlickrLogos fait référence à un ensemble de données composé de logos d'entreprise qui ont été photographiés dans une variété de positions différentes. Gérée par le laboratoire d'informatique multimédia et de vision par ordinateur de l'Université d'Augsbourg, cette collection a été compilée à l'origine dans le but d'entraîner les ordinateurs à reconnaître le logo et le texte. Pour rester au courant des progrès réalisés avec ce programme digne d'intérêt, il ne peut pas faire de mal de télécharger cet ensemble de données et de voir de quoi il s'agit.
278. ImageNet
ImageNet est une base de données pleine d'images qui ont été organisées par WordNet. Il existe des défis annuels sur le site qui peuvent être consultés même après la fermeture et sont axés sur la création d'algorithmes capables d'effectuer des tâches spécifiées. ImageNet héberge également de nombreuses publications, citations et diapositives. Les éditeurs de contenu axés sur la technologie auraient toutes les raisons d'utiliser l'option d'exploration pour donner un sens à la structure WordNet ainsi qu'à la carte des nuages.
279. Ensemble de données sur les chiens de Stanford
L'ensemble de données Stanford Dogs contient des tonnes de photos et d'images de différentes races de chiens. Avec 120 races de chiens différentes incluses ainsi que plus de 20 000 images individuelles, cette base de données alimentée par ImageNet offre aux chercheurs de nombreuses images avec lesquelles travailler tout en enseignant aux machines comment reconnaître chaque race de chien. Sur le site, des liens vers différentes publications traitant de l'utilisation d'ensembles de données pour enseigner aux ordinateurs la reconnaissance d'images peuvent être cliqués et lus avec le téléchargement de l'ensemble de données.
280. Base de données SUN
La base de données SUN est le site d'un projet mis en place pour que la communauté de la recherche fasse des progrès dans des domaines tels que la vision et le graphisme par ordinateur, l'exploration de données, l'apprentissage automatique et les neurosciences, entre autres. Bénéficiant de plus de 131 000 images et de près de 4 000 catégories d'objets dans ses index, ce site est aussi complet que possible. Pour les éditeurs qui s'intéressent à cette base de données et à ce que les chercheurs ont pu faire en l'utilisant, il s'agit d'une source de données qui mérite d'être explorée.
281. L'ensemble de données sur les animaux de compagnie Oxford-IIIT
L'ensemble de données Oxford-IIIT Pet est un site qui agit comme un complément à un article publié lors de la conférence IEEE 2012 sur la vision par ordinateur et la reconnaissance de formes et héberge l'ensemble de données original qui a été utilisé aux fins de l'article. Ces images ont été organisées en environ 37 catégories d'animaux de compagnie pour aller avec 200 autres images associées à chaque classe impliquée. De plus, ces données peuvent être téléchargées directement via les liens sur la page Web.
282. L'ensemble de données du génome visuel
L'API Visual Genome est le résultat final du travail acharné de plusieurs étudiants et professeurs associés de l'Université de Stanford. Avec plusieurs articles à son actif dans le but de créer une API capable d'évaluer et de décrire des images, le programme a répondu avec succès à plus d'un million de questions tout en évaluant plus de 100 000 images. Cette API représente un progrès dans le domaine de l'informatique et ses domaines connexes et l'ensemble de données peut être téléchargé directement sur le site.
283. Visages YouTube
La base de données YouTube Faces se concentre sur le développement d'une solution au problème de la reconnaissance faciale automatique dans les vidéos. Au total, l'ensemble de données contient plus de 3 000 vidéos extraites de YouTube de près de 1 600 individus d'une durée moyenne d'environ 181 images. En fin de compte, le but est de créer un algorithme capable de créer des étiquettes qui identifient la personne qui se trouve dans la vidéo. Les données ainsi que les informations sur les erreurs ainsi que les méthodes de description sont toutes disponibles pour consultation directement sur le site.
284. Dépôt de l'ensemble de données KEEL
Le référentiel d'ensembles de données KEEL contient l'ensemble de données du logiciel open source basé sur Java qui est conçu pour aider à divers types de découverte de données de connaissances. KEEL, connu simplement sous le nom d'extraction de connaissances basée sur l'apprentissage évolutif, peut être formé pour apprendre à ajouter des valeurs manquantes, des modèles hybrides et des méthodes statistiques pour évaluer des expériences parmi un certain nombre d'autres tâches. Les téléchargements d'ensembles de données ainsi qu'une liste complète des algorithmes présentés dans KEEL peuvent être téléchargés directement à partir du site.
285. Club de prêt
La renommée du Lending Club est son statut de prêteur peer-to-peer qui permet aux emprunteurs de recevoir des prêts même lorsqu'ils n'ont pas nécessairement le pointage de crédit pour emprunter auprès des prêteurs traditionnels. Outre les aspects novateurs du fonctionnement du site, il fournit également des statistiques qui incluent les faits saillants de la plate-forme, les informations sur les prêts refusés, les chiffres de performance des investisseurs et même un dictionnaire de données contenant des données historiques. Ces chiffres commencent généralement à partir de 2007 et peuvent être téléchargés au format CSV.
286. Musée d'histoire naturelle
Le Natural Museum of History est considéré par beaucoup comme l'un des musées les plus reconnaissables au monde, mais la numérisation et la possibilité d'examiner son catalogue via le portail de données ouvertes seraient probablement nouvelles pour beaucoup de gens. Avec 91 ensembles de données comprenant des collections de microfossiles et de fossiles ainsi que des enregistrements de lots d'index entre autres matériaux, les données sont ouvertes au public et téléchargeables gratuitement dans plusieurs formats.
Ce site est parfait pour les journalistes et les éditeurs qui souhaitent respecter certaines directives de style lors de la description et de la catégorisation de certains noms d'art, d'artistes, d'architecture, de matériaux et de noms géographiques. Ce site relie directement les utilisateurs aux bases de données de vocabulaire contrôlé que les chercheurs et les catalogueurs doivent connaître afin de répondre aux normes internationales. Ici au moins, il n'y a pas moyen de battre les vocabulaires Getty. Les ensembles de données peuvent être explorés par texte ou SPARQL et peuvent être téléchargés via le site.
288. Corpus d'enquête sur la stylométrie CLiPS (CSI)
Le CLiPS Stylometry Investigation Corpus n'est probablement pas ce à quoi la plupart des gens pensent lorsqu'ils entendent les mots CSI, mais le corpus CSI est néanmoins un ensemble de données composé de critiques et d'essais d'étudiants. Outre le texte lui-même, la présence de métadonnées et d'informations intégrées dans le document est notée par le site comme ayant de multiples usages. Proposé et distribué sous licence Creative Commons, tout ce que le corpus demande en échange de l'utilisation du jeu de données est une attribution.
289. Dépendances universelles v2
Universal Dependencies v2 fait référence à la deuxième version mise à jour du projet Universal Dependencies, un effort pour développer une annotation treebank qui peut être utilisée de manière cohérente avec plusieurs langues différentes. Dans la version mise à jour, les chercheurs trouveront des dizaines de banques d'arbres UD pour différentes langues, notamment l'afrikaans, le grec ancien, le japonais, le néerlandais, le finnois et le chinois en plus de l'anglais. La dernière version de Universal Dependencies peut être trouvée et téléchargée au bas de cette page Web.
290. Webhose
Webhose est une source de premier ordre d'ensembles de données extraits directement des référentiels du site et ouverts au public. Les chercheurs peuvent trier les articles de presse par langue, l'arabe, le français et le néerlandais n'étant que quelques-unes des langues dont les numéros d'article dépassent 100 000. De plus, les articles de presse en anglais sont divisés en catégories telles que le divertissement et les sports pour accompagner la critique et les messages du forum. Les éditeurs numériques et les chercheurs peuvent bénéficier de l'exploration de ces ensembles de données.
291. Données wiki
Wikidata est une source sous-estimée de contenu et d'idées pour les éditeurs et les chercheurs. Selon cette page, il existe un certain nombre de façons d'accéder au matériel dans les vidages de données, bien que l'utilisation de JSON soit celle que le site recommande le plus fortement. Disponibles et totalement gratuites pour un usage non commercial et commercial, toutes les données disponibles ici sont accessibles et téléchargeables gratuitement sous la licence Creative Commons.
292. Liens Wiki
Situé confortablement dans le cadre de Google Code, Wiki Links est un projet open source qui vise à fournir aux individus un accès à cet ensemble de données particulier et unique. Sur cette page Web, les chercheurs peuvent télécharger les textes README, les fichiers de données et la licence Creative Commons. Les éditeurs ou les personnes généralement axées sur la technologie ont beaucoup à attendre lorsqu'ils parcourent cet ensemble de données massif. Naviguez simplement sur le site, cliquez et commencez à télécharger les fichiers.
293. Wordnet
WordNet est un lexique anglais composé des composants de la langue, des adverbes, des noms, des adjectifs et des verbes qui sont classés en groupes distincts qui sont ensuite utilisés pour exprimer des idées particulières. Le résultat final est un outil utile qui catégorise les mots en fonction de la façon dont ils sont utilisés et de ce qu'ils signifient plutôt que de la façon dont ils sonnent lorsqu'ils sont prononcés. Les applications de WordNet en programmation linguistique sont notées ainsi que les nombreuses publications et statistiques disponibles sur le site.
L'Allen Brain Atlas, créé par l'Allen Institute for Brain Science Resources, est un outil permettant d'étudier et d'en apprendre davantage sur le cerveau humain et sur la façon dont il réagit lorsque le corps humain est en bonne santé ainsi qu'en cas de maladie. Grâce à l'atlas, les chercheurs peuvent en apprendre davantage sur le cerveau humain et son développement ainsi que sur le glioblastome et les effets du cancer sur le cerveau. Les journalistes couvrant ces sujets peuvent visiter ce site pour obtenir des ensembles de données et des informations.
295. NITRC
Le NITRC, ou Neuroimaging Informatics Tools and Resources Clearinghouse, est l'endroit où les journalistes et les éditeurs peuvent s'adresser pour la neuroimagerie. Conçu et promu comme une initiative de partage de données en neuroimagerie, ce site héberge les données de plusieurs projets tels que le projet 1000 Connectome, l'Addiction Connectome Preprocessed Initiative, ainsi que les projets INDI-Prospective et Rétrospective respectivement. Les particuliers sont libres de télécharger les données via le site Web. Les neuroimages prises à différentes étapes n’ont jamais été aussi accessibles.
296. HCP Jeune Adulte
Le projet Human Connectome Project Young Adult s’inscrit dans la continuité des efforts en cours visant à créer une carte précise du connectome humain tel qu’il serait observé chez la plupart des adultes normaux. En deux phases, 1 200 adultes en bonne santé ont été scannés grâce à une combinaison de techniques d’IRMf au repos et d’imagerie de diffusion. Les journalistes et les éditeurs à la recherche d'informations sur le cerveau ne trouveront pas d'autre site proposant davantage de données sur le connectome humain chez les jeunes adultes en bonne santé.
Le NIMH Data Archive, ou NDA en abrégé, n'est pas tant une source de données indépendante qu'une plate-forme de distribution et de stockage de données. Sur ce site Web, des données ont été collectées au cours de plusieurs articles et projets de recherche, ainsi que des méthodes et des outils permettant une meilleure analyse et une meilleure collaboration. Les résumés de données sont disponibles gratuitement et les fournisseurs de contenu rapportant les dernières avancées scientifiques peuvent utiliser ces informations pour annoncer l'actualité.
298. Neurodonnées
NeuroData se consacre à mener des recherches sur la relation unique entre l'esprit et le cerveau. Grâce à l'engagement du site en faveur de la science ouverte et de la recherche reproductible, les fournisseurs de contenu ont accès à une publication et à plusieurs ensembles de données accessibles en suivant les liens sur la page Web. La disponibilité de codes gratuits et d'outils d'analyse qui rendent l'exploration du travail de NeuroData encore plus simple est particulièrement intéressante pour ceux qui souhaitent consulter les données par eux-mêmes.
299. NeuroElectro
Le projet NeuroElectro est conçu dans le but de collecter les diverses caractéristiques électrophysiologiques associées à différents types de neurones et de les agréger dans une seule base de données. Ce projet vise à étudier la relation entre les neurones dans le but d'étudier les différences entre les différents types de neurones. Le site propose des liens vers des articles et répertorie les types de neurones et les propriétés électrophysiologiques découverts jusqu'à présent. Les fournisseurs de contenu peuvent s'appuyer sur ce site comme source de données sur les relations neurone à neurone.
300. Série d'études sur l'imagerie en libre accès
La série d’études d’imagerie en libre accès, également connue sous le nom d’OASIS, est un projet conçu dans le but de rendre accessibles à la communauté scientifique dans son ensemble des ensembles de données d’IRM cérébrales. Les journalistes et les chercheurs peuvent accéder à des publications qui comparent les données IRM entre adultes ainsi qu'à une fiche d'information complète tirée de l'article complet d'OASIS comparant et contrastant les résultats de plus de 400 sujets. Les informations et les outils peuvent être téléchargés à partir du site Web sous plusieurs formats.
301. OpenfMRI
Pour les journalistes qui souhaitent accéder aux ensembles de données IRM sans les tracas associés à certains autres sites, l'accent mis par OpenfMRI.org sur la mise à disposition des ensembles de données IRM au public est une évolution positive. Provenant directement des chercheurs eux-mêmes, ce site héberge une variété d'ensembles de données tels que l'ensemble de données d'apprentissage de classification, la tâche de paris mixtes et la tâche de prise de risque analogique en ballon. La variété et la quantité de données permettent aux chercheurs de trouver de nouvelles pistes de recherche grâce à ce site.
302. Étudeforrest
Empruntant largement son nom au célèbre film Forrest Gump, Studyforrest cherche à comprendre de quoi le cerveau est capable lorsqu'il doit fonctionner à un niveau supérieur tout en faisant face à une stimulation naturelle mais tout aussi complexe. Néanmoins, le site reconnaît que la quantité de données IRMf collectées à partir de ces études a des applications plus larges qu’il n’y paraît au premier abord. Les fournisseurs de contenu peuvent parcourir les 19 publications qui ont utilisé de StudyForrest et peuvent même accéder directement aux données.
303. Base de données ouverte sur la cristallographie
Comme on pouvait s'y attendre d'après le titre, la base de données ouverte de cristallographie est une collection de 385 697 minéraux et composés métallo-organiques, structures cristallines organiques et inorganiques, à l'exception notable des biopolymères. Les fournisseurs de contenu souhaitant en savoir plus sur les structures cristallines peuvent effectuer une recherche par formule structurelle ou exécuter une requête de recherche correspondante avec la possibilité de parcourir. Il existe également des logiciels et des données sur ce site qui rendent ce site Web particulièrement précieux dans le domaine de la chimie.
304. Archives des exoplanètes de la NASA
Longtemps considérée comme l'une des principales sources d'informations sur l'espace, la NASA poursuit sa tradition d'être une ressource inestimable avec ses archives sur les exoplanètes. Ce site héberge une série d'outils et de logiciels interactifs tels que le service Transit et éphémérides, le périodogramme, l'outil de traçage des planètes confirmées et la possibilité de télécharger de manière interactive des fichiers et des tableaux de recherche. Les fournisseurs de contenu à la recherche d’informations uniques pourront utiliser ces données pour le faire la prochaine fois que les exoplanètes feront l’actualité.
305. Enquête sur le ciel numérique de Sloan
La possibilité de créer des cartes tridimensionnelles de l’Univers est accessible à tous avec l’aide du Sloan Digital Sky Survey, ou SDSS. Les journalistes et les fournisseurs de contenu peuvent accéder à des algorithmes, des données d'imagerie, des ensembles de données, des didacticiels et à des développements ultérieurs de matériel visuel dans le but d'éduquer le public de manière formelle et informelle. Le site discute également explicitement de rendre ses données accessibles au public via les actualités et les réseaux sociaux. Il s'agit d'un outil visuel inestimable pour les fournisseurs de contenu.
306. StatSci.org
Statsci.org propose une liste complète de ressources auxquelles le public peut accéder et utiliser en fonction de ses besoins particuliers. Certaines informations incluent le service d'ensembles de données électroniques et des études de cas compilées par l'UCLA. Outre les ensembles de données brutes, il existe également des manuels liés sur cette page. Cela inclut des titres tels que le Manuel des petits ensembles de données et les études de cas en biométrie. Les fournisseurs de contenu à la recherche de statistiques ne peuvent pas se tromper en y jetant un coup d'œil.
307. ÉRIC
ERIC, également connu sous le nom d'Institut des sciences de l'éducation, est une ressource qui fait office de moteur de recherche pour quiconque recherche des informations sur le domaine de l'éducation. La recherche préliminaire offre même la possibilité de filtrer exclusivement les informations évaluées par des pairs ainsi que les textes intégraux basés sur ERIC. Compte tenu de la fréquence à laquelle les budgets éducatifs et les méthodes pédagogiques semblent faire l’actualité, il s’agit d’une source de données que les journalistes devraient garder à l’esprit.
308. NTIS
Créé peu de temps après la fin de la Seconde Guerre mondiale, le NTIS (National Technical Information Service) a été créé dans le but d'utiliser les données pour aider les agences fédérales à prendre des décisions éclairées fondées sur des données grâce à l'utilisation de données. Cette agence était à l'origine le référentiel de données du gouvernement américain dans le domaine de la recherche scientifique. Aujourd'hui, le site héberge des millions de publications sur une myriade de sujets. Les informations historiques à elles seules font de ce site une source de données bien méritée pour les journalistes et les éditeurs.
309. Certificat de données ouvertes
Le site Web de l'ODI (Open Data Institute) héberge ce qu'on appelle l'Open Data Certificate, un outil gratuit disponible en ligne qui a été développé dans le but exprès d'examiner de manière critique et de reconnaître la qualité des données ouvertes. Du point de vue d'un éditeur ou d'un journaliste, le site héberge également de nombreux ensembles de données sur des sujets allant des listes de subventions aux alertes allergies en passant par des listes téléchargeables au format CSV.
310. Archives GitHub
GitHub est sans conteste l'un des référentiels de données et d'archives les plus populaires et les plus connus sur Internet en raison de sa facilité de collaboration, de ses capacités d'archivage et de son accessibilité en matière de codage. Qu'il s'agisse de tentatives de création de robots capables d'effectuer certaines tâches ou de développement d'applications, GitHub est un site sur lequel les éditeurs de contenu et les journalistes peuvent facilement tomber sur des produits potentiellement dignes d'intérêt. L'archive est accessible en suivant les instructions du didacticiel pour JSON ou Big Query.
311. Modèles sociaux
SocioPatterns est un projet axé sur la recherche de modèles d'activité humaine et de dynamiques sociales à l'aide de données. Comme on peut s'y attendre avec un objectif aussi large, les informations du site ont été utilisées dans des publications traitant d'une gamme de sujets allant de la propagation des maladies aux études de cas sur les différences entre les personnalités des individus en ligne et hors ligne. Les ensembles de données peuvent être consultés, tout comme les articles publiés contenant des informations que les éditeurs trouveront probablement pertinentes à un moment ou à un autre.
312. Carte indépendante
Indie Map est le résultat de la collecte d'informations provenant de plus de 2 000 des sites IndieWeb les plus fréquentés et de la transformation des données dans des formulaires visuels interactifs tels qu'une API Social Graph, un ensemble de données avec des capacités de requête SQL et les informations brutes qui ont été analysées sur un total de 5,7. millions de pages Web. Les éditeurs numériques intéressés par les logiciels open source et par ce que ces données pourraient dire sur ces communautés en ligne peuvent accéder aux informations directement depuis le site Web.
Simon Fraser continue de bâtir sur son statut d'université réputée avec la disponibilité de son ensemble de données concernant les « Statistiques et réseau social des vidéos YouTube ». Tirant des informations d'un robot d'exploration qui a utilisé l'API de YouTube pour rechercher des vidéos, les fichiers contiennent des données sur des millions de vidéos et des ensembles de données d'informations utilisateur. Le site précise que les téléchargements d'ensembles de données sont uniquement à des fins académiques, mais il peut être possible de trouver des sources journalistiques et des références sur ce projet via le site.
314. ACLED
ACLED, ou Armed Conflict Location and Event Data Project, propose des données publiques concernant les manifestations et la violence politique dans les pays en développement. Les informations fournies ici comprennent le nombre de morts, des informations sur les dates et les lieux des violences ou des manifestations, les noms des groupes concernés et des données sur les émeutes et les affrontements violents qui ont eu lieu. ACLED donne accès à des rapports, publications et visuels réguliers ainsi qu'à des données disponibles en téléchargement sur le site.
315. Institut canadien d'information juridique
L'Institut canadien d'information juridique, ou CanLII comme on l'appelle dans le langage courant, est un site qui offre un accès gratuit aux lois et à leurs règlements, à la jurisprudence des tribunaux de diverses juridictions, dont la Cour suprême du Canada, les cours provinciales et d'appel, et la Cour de justice de la Reine. Banc, ainsi que les décisions de divers tribunaux administratifs et organismes créés par la loi. Avec 301 bases de données de jurisprudence et plus de 140 000 décisions de justice consultables, les journalistes et les éditeurs numériques qui couvrent des sujets juridiques gagneraient à ajouter ce site à leurs favoris.
316. Centre pour la paix systémique
Le Center for Systemic Peace, ou CSP, est une organisation qui se consacre à l'analyse des systèmes mondiaux dans le but d'aborder la question de la violence politique. Sur ce site, les journalistes qui effectuent des recherches dans ce domaine auront accès à des analyses sur les conflits en Afrique, aux tendances des conflits au niveau mondial, entre autres, ainsi qu'à des résumés des trois principales publications de l'organisation telles que Third World War et le Rapport mondial et virtuel du CSP. Bibliothèque.
317. Projet Corrélats de guerre
L'objectif du projet Correlates of War, ou COW, est d'aider à la collecte et à la distribution de données quantitatives, comme dans le domaine des relations internationales. Fidèle à son engagement à appliquer des principes scientifiques aux données sur les relations internationales, COW rend ses ensembles de données librement accessibles au public. Ces bases de données contiennent des chiffres sur les informations que les journalistes et les chercheurs peuvent utiliser, telles que les conflits militarisés entre États, les membres du système étatique, les capacités matérielles nationales et les alliances formelles.
318. Enquête sociale européenne
L'Enquête sociale européenne, ou ESS, est une enquête menée dans toute l'Europe dans le but de mesurer les différents modèles de comportement, attitudes et croyances de différentes populations dans divers pays. Étant donné que les journalistes souhaitent souvent connaître l'opinion du public, la série ESS Topline, couvrant des sujets allant du bien-être personnel et social des Européens, aux attitudes à l'égard de l'aide sociale et même à la présence de l'âgisme au Royaume-Uni, peut renforcer un article de manière plus approfondie. façons plus d'une.
319. Fonds pour la paix
Le Fonds pour la paix est une organisation qui se concentre sur la prévention des conflits et sur la sécurité grâce au développement d'outils pouvant être utilisés pour atténuer les conflits. Au cours de sa carrière, la FFP a travaillé en partenariat avec des journalistes, des ONG, des organisations locales et leurs homologues internationales, ainsi qu'avec des gouvernements. Qu'ils recherchent des tendances, des analyses comparatives et des données mondiales, les journalistes et les éditeurs peuvent trouver les documents qu'ils souhaitent grâce à l'outil d'exploration de données intégré au navigateur du site.
320. L'Enquête sociale générale
Le travail de l'Enquête sociale générale (ESG) se concentre sur la collecte d'informations sur divers aspects de la société américaine moderne afin de se tenir au courant des tendances et des modèles d'attitude et de comportement de la population. Avec cette pratique de suivi des tendances remontant à 1972, les données historiques à elles seules constituent une mine d’or pour les journalistes qui souhaitent explorer les tendances. Grâce à GSS Data Explorer, les chercheurs et les journalistes peuvent télécharger, examiner et même évaluer des données.
321. Gésis
GESIS est un institut d'infrastructure allemand dédié aux sciences sociales. Il propose différentes sciences sociales, ainsi que des travaux et des services de recherche allant de la méthodologie d'enquête à l'informatique appliquée, en passant par la collecte de données, la planification d'études et l'analyse de données, pour ne citer que quelques-unes des activités du GESIS. Les journalistes intéressés par des sujets tels que l'approche méthodologique du GESIS, l'utilisation d'immigrants surqualifiés, etc. peuvent trouver de nombreuses informations dans la section publication.
322. L’avenir religieux mondial
Qu'il s'agisse de sujets tels que l'avortement ou l'éducation sexuelle, la religion est si omniprésente que même dans les pays largement laïcs, la position d'une personne sur des sujets sociaux difficiles peut être influencée par la croyance religieuse. Dans Global Religious Futures, le Pew Research Center examine les tendances dans les attitudes et les croyances des gens par rapport aux religions mondiales. Les journalistes qui cherchent à examiner des détails tels que l’influence de l’évangélisme en politique ou les attitudes à l’égard de la lapidation peuvent utiliser l’Explorateur de données pour trouver des réponses dans les chiffres.
323. Index pour la gestion des risques
L'Indice de gestion des risques, également connu sous le nom d'INFORM, est un endroit vers lequel les chercheurs et les journalistes peuvent s'adresser pour évaluer les risques dans les situations où il existe un risque de crise humanitaire ou de catastrophe. L'organisation propose des liens vers des données sur des sujets tels que les taux de mortalité infantile, l'indice d'inégalité entre les sexes et la fréquence des sécheresses, entre autres chiffres. Il est également possible de voir et de télécharger les données d'INFORM ou d'y accéder via la carte interactive du site.
324. INED
L'Ined, ou Institut français d'études démographiques, est l'une des sources de données et de statistiques les plus prolifiques qu'un journaliste puisse trouver sur Internet. Avec plus de 70 publications faisant l'objet de recherches et publiées chaque année pour accompagner la population mondiale sous forme de graphiques ainsi que des statistiques qui mesurent des questions telles que la différence de fécondité entre les sexes, ainsi que des méthodes d'actualité et de ressources. Les chercheurs à la recherche de résultats précis provenant d’une source fiable les trouveront auprès de l’Ined.
325. Archives des réseaux internationaux
Les archives des réseaux internationaux de Princeton offrent une combinaison unique de publications, avec des recherches telles que le Rapport sur le développement humain 1999 et Global Networks: A Journal of Transnational Affairs, disponibles en lecture sur ce site. Sur ce site, les journalistes pourront examiner les données publiques historiques et mises à jour complètes des archives. Les sujets abordés ici incluent les soins de santé, les armes, les livres, la musique, la migration, les régions, Internet, la politique et les transports ne sont que quelques exemples des documents que les chercheurs peuvent parcourir ici.
326. Programme international d'enquêtes sociales
Fondé dès le début comme moyen de collaboration entre des personnes de différentes nations, l'International Social Survey Program (ISSP) mène chaque année des enquêtes sur une variété de sujets importants dans le domaine des sciences sociales. Au fil des ans, les sujets ont inclus, entre autres, les inégalités sociales, l'identité nationale, la citoyenneté, les réseaux sociaux et l'orientation professionnelle. Les résultats de l'ISSP peuvent être recherchés par année ou par thème et peuvent être téléchargés en conséquence sur le site Internet.
327. Associations d'études internationales
Journalistes ou autres chercheurs qui recherchent une discussion informative et intellectuelle sur des questions liées aux questions transnationales, internationales et mondiales, l'International Studies Association (ISA) rassemble l'expertise de chercheurs, d'universitaires et d'experts politiques parmi Autres noms. L'Encyclopédie des études internationales de l'ISA présente des essais évalués par des pairs qui regorgent de discussions approfondies sur des sujets concernant la recherche dans ce domaine, ainsi que des essais qui fournissent des informations présentées dans une perspective plus historique.
328. Données transnationales sur le Web
La page incroyablement utile du professeur James W. McGuire de l'Université Wesleyan, intitulée à juste titre Données transnationales sur le Web, est une page de ressources pleine de liens vers des données pertinentes sur l'économie et le développement mondial. Parmi les ensembles de données que les journalistes en quête pourront découvrir ici, il y a des données sur la planification familiale, la réussite scolaire, la sous-alimentation, l'eau et l'assainissement, l'orientation vers le libre marché et des informations spécifiques à l'Amérique latine et aux Caraïbes, pour n'en citer que quelques-unes de la liste. Les sources de données répertoriées ici sont impeccables.
329. Centre norvégien de données de recherche
Le Centre norvégien pour les données de recherche est une institution qui soutient et aide les chercheurs dans différents domaines de recherche empirique tels que la confidentialité, la collecte et l'analyse de données, l'évaluation des méthodologies et l'éthique de la recherche. Ici, les chercheurs trouveront des logiciels et des outils développés et recommandés par le centre pour accompagner une vaste collection de données régionales, individuelles et institutionnelles accessibles gratuitement. Les conclusions du centre dans le rapport annuel sur la recherche et la confidentialité sont également toujours une lecture intéressante.
330. IPUMS
IPUMS n'est pas nécessairement une source de données dans le sens auquel la plupart des gens s'attendraient en entendant le terme, mais c'est néanmoins une source utile pour les journalistes en raison de son rôle d'agrégateur, d'archiveur et d'organisateur des données que d'autres entités lui fournissent. Par exemple, IPUMS USA agit comme une sorte de référentiel de données pour les microdonnées du recensement américain, avec des données remontant à 1790 et remontant jusqu'à nos jours.
331. ND-GAIN
L'indice national ND-GAIN, une initiative organisée par la Global Adaptation Initiative de l'Université de Notre Dame, mesure la résilience d'un pays au changement climatique et aux autres forces de la mondialisation. Cet indice comprend des scores de vulnérabilité dans des domaines tels que l'alimentation, la santé, les infrastructures et les écosystèmes, ainsi que des scores de préparation pour jusqu'à 500 000 points de données. Contenant deux décennies de données allant de 1995 à 2014 sous forme de fichiers CSV, ces informations sont disponibles en téléchargement.
Sur ce site, les journalistes et les éditeurs peuvent accéder à des données ouvertes concernant l'état du maintien de l'ordre et de la criminalité au Royaume-Uni. Les données contiennent des statistiques utiles sur les équipes de quartier, les forces de police individuelles, les chiffres des contrôles et des fouilles, ainsi que des statistiques sur la criminalité et leurs résultats. Grâce à ce site, les journalistes peuvent comparer les forces de police et repérer les tendances de la justice pénale. Obtenir des informations est aussi simple que de choisir la plage de dates, de choisir le corps de police, puis d'attendre le dossier.
333. Page de données internationales générales de Paul Hensel
La page de données internationales générales de Paul Hensel est une série de liens regroupés sous les titres États et système international, données géographiques internationales, capacités des États, collections de données en sciences sociales et alliances, traités et organisations. Chaque ressource répertoriée sur cette page Web contient des données de pointe qui donneront automatiquement de la crédibilité au travail d'un journaliste. Ces sources peuvent inclure n'importe quoi, des logiciels aux ensembles de données et archives, mais chaque lien inclus ici est utile.
334. TRAC
Dans le monde post-11 septembre, le terrorisme et ses effets dévastateurs sur les populations locales ont retenu beaucoup l’attention des médias. TRAC, sur trackingterrorism.org, fournit aux chercheurs des analyses et des informations approfondies sur ces sujets. Ce site contient des informations sur plusieurs milliers de groupes terroristes différents. Le prix pour un utilisateur unique de 500 $ est peut-être un peu élevé au départ, mais il vaut bien le prix payé pour ceux qui écrivent sur la violence et la guerre contre le terrorisme.
335. Département de justice pénale du Texas
Intéressé par le fonctionnement interne du système de justice pénale du Texas ? Curieux de savoir qui est actuellement dans le couloir de la mort ? Le Département de justice pénale de l'État du Texas dispose de nombreuses informations provenant des dernières déclarations des prisonniers avant leur exécution, des statistiques des couloirs de la mort par sexe et race, ainsi que d'autres statistiques et fiches d'information sur les exécutions. Le ministère de la Justice pénale du Texas est une source aussi fiable que possible pour les journalistes.
336. Système intégré des organisations de la société civile
Le système intégré des organisations de la société civile, ou iCSO, est conçu pour faciliter la communication entre les organisations de la société civile et le Département des affaires économiques et sociales. En plus de l'efficacité du cadre robuste, la page Web comprend des ensembles de données et des catégories pour des informations complémentaires. Les données peuvent être triées par secteur, type d'organisation, région concernée et statut ECOSOC de l'organisation. Il s'agit d'une source de données que les journalistes peuvent certainement utiliser pour trouver des sources.
337. Universités dans le monde
Universities Worldwide est une base de données d'universités du monde entier dans laquelle vous pouvez rechercher des informations complémentaires. La recherche peut être effectuée par liste mondiale ou filtrée exclusivement sur les universités américaines, et les utilisateurs peuvent également ajouter leurs propres liens dans le processus. Les éditeurs de données comptant un nombre important d’étudiants, ou même les journalistes qui cherchent à vérifier un fait, peuvent tous bénéficier de la possibilité d’accéder à une base de données comme celle-ci à la demande.
338. Programme de données sur les conflits d'Uppsala
Il s'agit du site Web du Uppsala Conflict Data Program, qui est l'un des fournisseurs d'informations les plus connus sur la violence organisée. Au cours des 40 dernières années, le programme s'est également imposé grâce à son travail de collecte de données sur la guerre civile. Les journalistes peuvent utiliser cette source de données pour rechercher des informations sur des conflits spécifiques et sur les acteurs de ces conflits et peuvent également accéder à ces données dans le but de les télécharger.
339. Pop mondiale
Le projet WorldPop, résultat final de la fusion des projets AsiaPop, AfriPop et AmeriPop, est dédié à l'archivage d'ensembles de données démographiques spatiales qui, à leur tour, ont des applications comme moyen de soutenir les efforts de secours en cas de catastrophe. Les éditeurs de contenu et les journalistes impliqués dans des causes de justice sociale ou qui recherchent des opportunités efficaces de secours en cas de catastrophe seraient susceptibles d'être intéressés par ce projet. Les chercheurs peuvent télécharger les données ou consulter les études de cas en ligne.
340. Brouillon Express
DraftExpress est peut-être plus connu sur Internet pour ses recherches, ses rapports de dépistage préalables, ses simulations de sélections au repêchage et sa maintenance méticuleuse de la taille et des mesures des joueurs pour accompagner ses données historiques. Les prospects mentionnés sur ce site proviennent de la NCAA, du lycée et même des ligues internationales. Les journalistes sportifs ou les fournisseurs de contenu qui ont l'intention de proposer des commentaires sur le basket-ball peuvent se tourner vers les statistiques de DraftExpress tout en discutant des joueurs et des événements au fur et à mesure qu'ils se déroulent dans le sport.
341. Betfair
Betfair est peut-être mieux connu comme le site idéal pour les paris sportifs. Toutefois, ce qui intéresse particulièrement les fournisseurs de contenu et les éditeurs numériques, c'est la disponibilité d'informations historiques détaillées sur les données de tarification et l'historique du site. Les données peuvent être consultées et téléchargées avec ou sans horodatage détaillé, tout en offrant également des données détaillées sur les courses de chevaux et les autres offres du marché du site de juin 2004 à octobre 2017.
342. FICHE CRIC
Cricsheet propose un service similaire à un certain nombre d'autres centres de données sportives, mais il s'agit d'un site spécialisé exclusivement dans la fourniture de données sur le cricket. Le site propose des statistiques et des données balle par balle d'un certain nombre de ligues, dont la Premier League indienne, des matchs internationaux d'une journée, ainsi que des chiffres pour les équipes masculines et féminines, pour ne citer que quelques-unes des plus grandes catégories. Les éditeurs de contenu à la recherche de données historiques sur le cricket peuvent télécharger les données au format CSV ou XML.
343. Données de séries chronologiques transnationales
Avec des données sur les conflits politiques, économiques, législatifs et nationaux couvrant plus de 200 ans dans plus de 200 pays à travers le monde, les archives de données de séries chronologiques transnationales sont l'un des ensembles de données les plus complets sur Internet. Les données sont stockées, de manière plus pratique, dans une feuille Google Drive qui s'ouvre automatiquement en cliquant sur la catégorie du fichier. En échange d'une citation, ces informations peuvent être consultées en partie ou en totalité selon les besoins du chercheur.
344. Ford GoBike
Ford GoBike est le nom du programme de vélos en libre-service utilisé dans la Bay Area. Alors que de nombreuses personnes utilisent sans aucun doute ce programme pour rester en forme et éviter d’utiliser des combustibles fossiles, le système de vélos en libre-service conserve une trace des données de déplacement. Bien entendu, ces informations n'incluent rien qui pourrait identifier les coureurs, mais des détails tels que le numéro du vélo, l'heure de départ, l'heure de fin, le type de coureur et les gares d'arrivée et de départ sont inclus dans les données. Cela vaut la peine d'être exploré.
345. Trafic maritime
Marine Traffic est une entreprise qui trace et suit les mouvements des navires et les voyages en mer à l'aide du big data. Le type d'informations couvertes par les services API AIS de Marine Traffic comprenait les navires, les informations sur les voyages et les données sur les navires en question telles que les arrivées prévues, voire les incidents, les photos, les détails du navire et les prévisions de voyage. Il existe cependant des plans tarifaires sur ce site, il est donc difficile de savoir combien de recherches peuvent être effectuées gratuitement.
346. Bixi
Les programmes de vélos en libre-service Bixi sont peut-être parmi les programmes de vélos en libre-service les plus connus dans certaines des plus grandes villes d'Amérique du Nord. Il est intéressant de noter que la marque publie également des données ouvertes qui fournissent des informations sur des éléments tels que l'historique des trajets et l'état des stations, ainsi que des comparaisons qui pourraient être faites entre les membres et les utilisateurs occasionnels. Les journalistes locaux qui étudient la manière dont les individus utilisent et intègrent les programmes de vélos en libre-service dans leur vie ont toutes les raisons de se pencher sur ces données.
347. Base de données des accidents
D'Amelia Earhart au vol AirAsia 8501 en Indonésie, les accidents d'avion et d'avion sont un sujet qui attire l'attention des gens. La base de données sur les accidents archive et stocke des données sur les accidents d'aviation survenus entre 1920 et 2017. Les accidents recensés dans cette base de données comprenaient les accidents de dirigeables civils et militaires, les accidents ayant entraîné la mort de célébrités ou de personnes célèbres, les accidents d'hélicoptère ayant fait 10 morts ou plus. , vols aériens de passagers réguliers et non réguliers qui se sont soldés par des décès.
Transport for London est l'organisme gouvernemental chargé de superviser les transports publics dans la région du Grand Londres. Des plans des métros et des chemins de fer sont disponibles sur le site Web ainsi qu'un guide de planification de voyage. En plus de tous ces services pratiques, le site héberge également de nombreuses données ouvertes dont le vélo, la qualité de l'air, le bain ou encore l'huître. Toute personne souhaitant savoir comment les résidents du Grand Londres utilisent les transports publics peut bénéficier de l’accès à ces données.
349. CMAP
Le CMAP est responsable de la planification et de l'organisation régionales dans les comtés de DuPage, Lake, McHenry, Kendall, Kane, Cook et Will dans l'Illinois. Comme le montre le site Web, les responsabilités du CMAP s'étendent au traitement de questions telles que le développement communautaire, les impôts et les indicateurs économiques, et même les routes et le transport en commun. C'est pourquoi les données ouvertes concernant des domaines tels que les indicateurs régionaux et les voyages sont utiles au journaliste qui tente de comprendre la situation dans son ensemble en ce qui concerne l'avenir de la région.
Né d'une collaboration entre le Bureau of Transportation Statistics et la Federal Highway Administration, le Freight Analysis Framework collecte des données qui sont ensuite utilisées pour évaluer la santé générale et les performances du système de fret. Ce logiciel collecte des informations sur des détails tels que le type et le tonnage des produits par rapport aux stations de départ et d'arrivée et ces données ont à leur tour été mises à la disposition du public pour qu'il puisse y accéder et les télécharger dans leur intégralité ou sous forme de résumé.
351. Mozilla Science
Mozilla Science est un logiciel collaboratif open source et ouvert qui est là pour aider au développement et à la distribution de différentes sources de données et résultats de recherche. Mis à part les intérêts de transparence, la décision d’ouvrir les programmes et de externaliser le processus de raffinement facilite l’amélioration des programmes déjà en place. Avec des projets disponibles dans une variété de domaines, notamment les sciences de la vie et la médecine, il existe ici des solutions logicielles qui peuvent représenter des progrès dignes d'intérêt dans le domaine.
352. Ensembles de données sympas
L’attrait pour Cool Datasets ressort facilement du nom du site. Sur cette page, les ensembles de données relèvent de six catégories générales : gouvernement, divertissement, science, soumissions d'utilisateurs, divers et apprentissage automatique. Les journalistes qui souhaitent explorer les données et extraire des articles ont tout à gagner en consultant ce que ce site Web a à offrir. Il existe une option permettant d'explorer les ensembles de données et, si possible, de contribuer également à des ensembles de données.
353. Moniteur de données ouvertes
OpenDataMonitor est une plateforme qui prend des ensembles de données publics et les présente d'une manière plus intuitive et plus facile à suivre pour les individus. Les chercheurs peuvent accéder à la plateforme pour voir un résumé de ce dont sont capables les ressources de données ouvertes, et ils pourront voir les données existantes qui leur sont présentées d'une manière visuellement plus attrayante. Le site explique sa méthodologie et ses benchmarks, et les éditeurs ne devraient avoir aucun problème à trouver des données qui valent la peine d'être publiées.
354. CrunchBase
CrunchBase est peut-être mieux connu pour l'accent qu'il met sur les statistiques et son engagement à permettre à ses lecteurs d'accéder aux meilleures données disponibles. Des personnes à l'esprit d'affaires viennent chaque jour sur ce site pour se renseigner sur les dernières tendances en matière d'investissement et d'industrie. Ici, les journalistes et les éditeurs trouveront des nouvelles et des discussions fraîches sur les dernières tendances économiques. Parallèlement, dans le cadre de son option payante, le site héberge également de nombreux ensembles de données qui peuvent être analysés à l'aide des outils logiciels de Crunchbase.
355. Indice
Index est une plateforme avec une proposition de vente unique car elle a quelque chose à offrir à tout le monde, qu'il s'agisse de startups, d'investisseurs, d'analystes ou d'entreprises. Le site héberge également des informations sur plus de 100 000 entreprises du secteur technologique tout en offrant aux utilisateurs la possibilité de trier, créer et exporter des feuilles de calcul. Les éditeurs et les journalistes qui parcourent les gros titres à la recherche d'angles d'histoire potentiels peuvent devancer l'actualité économique grâce à ce site. L'index est peut-être inhabituel, mais il ne fait aucun doute qu'il s'agit d'une ressource utile.
356. SEMRUSH
SEMrush est fier d'être l'un des outils d'intelligence de recherche les mieux établis disponibles pour les spécialistes du marketing en ligne. Entre l’académie et les webinaires, les chercheurs ont toutes les chances d’apprendre les fondamentaux. Cependant, les sections blog et actualités contiennent suffisamment d’informations pour que les éditeurs et les journalistes puissent facilement rester au courant de toutes les dernières actualités en matière de publicité en ligne et de référencement. Les services de SEMrush ont un prix, mais ils fournissent gratuitement de nombreuses informations de qualité.
357. Ahrefs
Ahrefs se résume peut-être mieux comme une suite d’outils marketing potentiellement utiles à toute personne publiant du contenu en ligne. Le site propose une combinaison de services tels que la recherche de contenu, la surveillance Web, la recherche de mots clés et la recherche de backlinks pour aider les utilisateurs à procéder à une ingénierie inverse du succès des concurrents. Probablement le plus utile aux éditeurs en ligne dans l’ensemble, le blog Ahrefs représente à lui seul une excellente valeur pour ceux qui aiment que leur marketing soit basé sur les données.
358. Liste des anges
AngelList, avec son nom intelligemment choisi, est essentiellement constitué de deux parties Craigslist et d'une partie LinkedIn, qui met l'accent sur le rassemblement des investisseurs, des demandeurs d'emploi et des startups en un seul endroit. Parallèlement à ce concept de site intéressant, les journalistes entreprenants ont de nombreuses opportunités de découvrir les startups les plus en vogue et les dernières tendances en matière d'investissement avant qu'elles ne deviennent courantes. Avec son interface simple et sa forte orientation business, ce site est utile aux professionnels à plus d'un titre.
359. Acquis
Dans presque tous les secteurs, une acquisition d’entreprise peut changer toute une industrie pratiquement du jour au lendemain. Acquired est un site qui a pour mission de tenir le public informé lorsqu'une acquisition a été réalisée dans le secteur technologique. Remplis de statistiques pouvant être consultées sur le site et associées à la possibilité de filtrer les recherches, les journalistes qui écrivent sur la technologie ont tout à gagner en intégrant Acquired à leur navigation quotidienne sur le Web.
360. Marque de matière
Mattermark est un service payant qui facilite la vie des décideurs des entreprises en produisant des listes de clients de qualité qui prennent en compte à la fois les entreprises et leurs employés clés. Offrant des profils d’entreprise complets, de la flexibilité avec son API et même des capacités d’exportation pour effectuer des mises à jour, Mattermark met tout en œuvre. Les entreprises qui souhaitent mieux cibler leur portée tout en suivant les résultats de leurs campagnes ont tout à gagner en s'inscrivant à ce programme.
361. Startups Fintech
FintechStartupsCo sert comme une sorte d'agrégateur qui suit le montant que différentes entreprises ont pu lever lors de leurs introductions en bourse. Arborant un design minimaliste qui bascule entre les onglets « startups » et « actualités », il s'agit d'un moyen rapide et facile pour les journalistes de rester au courant des dernières nouvelles en matière de collecte de fonds. Pendant ce temps, les éditeurs à la recherche de contenu rapide et d’histoires rapides ont également intérêt à jeter un nouveau regard sur ce que ce site a à offrir.
362. Datafox
Juste au cas où son nom ne révélerait pas tout, DataFox est une entreprise qui s'efforce de fournir à ses clients professionnels les informations dont ils ont besoin pour optimiser leurs CRM et, de manière générale, prendre des décisions fondées sur les données. Offrant des services comprenant des informations de conférence et d'entreprise, des API et des signaux d'entreprise, cette société est en fait un guichet unique pour les entreprises qui réorganisent leur travail de vente et de sensibilisation. Les éditeurs numériques et les fournisseurs de contenu voudront peut-être également le consulter.
363. Envoi ouvert
OpenSending est une plateforme gratuite, accessible pratiquement partout dans le monde, qui permet aux utilisateurs de rechercher et d'examiner des données financières dans le domaine public. Pour les membres de la société qui ne piratent pas, il s’agit d’un outil puissant de visualisation et d’analyse. Les journalistes, en particulier, peuvent utiliser OpenSending pour trouver de nouvelles informations intéressantes et poursuivre des angles de reportage, comme le suggère l'entreprise directement sur son site. En prime, les journalistes font partie des métiers spécifiquement demandés sur le forum.
364. API sportive ESPN
Non content d'être la chaîne sportive la plus populaire sur le câble, ESPN étend son influence au codage et aux API. Dans le Developer Center, le site propose aux éditeurs leur choix parmi plusieurs API, notamment des notes de recherche, des classements de puissance, des sélections de brouillons, des calendriers et des titres. Il existe même une API qui charge les profils d'athlètes, les biographies et les statistiques de tous les sports majeurs. Les journalistes qui se préparent à écrire un article à contenu sportif ne peuvent que bénéficier de leur navigation.
365. Référence sportive
Pour les amateurs de sport qui aiment les statistiques avancées et les ressources réunies au même endroit, Sports Reference est l'un des meilleurs sites du Web. Avec des données historiques comprenant des statistiques d'équipe et de joueur sur l'attaque et la défense, les chercheurs sportifs peuvent aller aussi loin ou aussi près qu'ils le souhaitent avec ce site. En outre, il existe des chiffres pour pratiquement tous les sports majeurs, du basket-ball au baseball, ainsi que des données distinctes pour différents sports universitaires.
366. Ensemble de données d'un million de chansons
La bien nommée « Million Songs Collection » représente 28 ensembles de données complets de métadonnées et d’informations sur les caractéristiques audio d’exactement un million de chansons. En grande partie résultat du travail du LabROSA de l'Université de Columbia aux côtés d'Echo Nest, ces informations sont accessibles et hébergées sur le système AWS d'Amazon. Les utilisateurs peuvent effectuer des recherches d'informations via Infochimps, ce qui les rend encore plus accessibles aux journalistes à la recherche d'informations obscures ainsi qu'aux éditeurs de contenu.