Esistono molti tipi diversi di siti che forniscono una vasta gamma di dati gratuiti, freemium e a pagamento che possono aiutare gli sviluppatori e i giornalisti del pubblico nei loro sforzi di reportistica e narrazione. Il team di State of Digital Publishing vorrebbe riconoscerli, poiché derivano da ricerche manuali e il riconoscimento da parte del nostro pubblico esistente.
1. Kaggle
Kaggle è un sito che consente agli utenti di scoprire l'apprendimento automatico mentre scrivono e condividono codice basato su cloud. Basandosi principalmente sull'entusiasmo della sua considerevole comunità, il sito ospita concorsi di set di dati per premi in denaro e di conseguenza ha al suo interno enormi quantità di dati compilati. Che tu stia cercando dati storici della Borsa di New York, una panoramica delle tendenze di produzione di caramelle negli Stati Uniti o codici all'avanguardia, questo sito è pieno zeppo di informazioni.
2. Wikipedia
È impossibile rimanere a lungo su Internet senza imbattersi in un articolo di Wikipedia. Con articoli che spaziano da biografie storiche con fonti complete e riferimenti a linee temporali del futuro prossimo e lontano, si può dire con certezza che Wikipedia ha consolidato il suo status di enciclopedia gratuita basata sul web. Tra la voce che funge da panoramica generale dell'argomento e i numerosi libri e riferimenti online forniti dal sito, Wikipedia è la migliore amica di uno scrittore sotto molti aspetti.
Come si può supporre dal nome del sito Web, Common Crawl ricerca o "scansiona" il Web alla ricerca di dati che poi archivia e crea in un repository aperto a cui gli utenti possono accedere. Per due esempi di ciò che è possibile fare con questo sito, i marcatori di brevetti virtuali e gli elenchi completi di siti Web che offrono feed RSS forniscono un piccolo esempio della potenza di questa applicazione. Se desideri effettuare confronti tra dati o siti, questo è uno strumento accessibile per creare informazioni originali.
4. EDRM
EDRM, abbreviazione di Electronic Discovery Reference Model, è un sito per professionisti legali dedicato a realizzare il potenziale dell'e-discovery e le regole e le aspettative relative al modo in cui vengono governate le informazioni. Inoltre, i membri EDRM lavorano insieme per sviluppare standard collaborativi, software e strumenti didattici progettati per promuovere gli obiettivi della comunità. Per raccogliere informazioni sui modi in cui la tecnologia può e ha cambiato gli aspetti procedurali e amministrativi della pratica legale, questo è il sito che vuoi visitare.
5. Mahout
Mahout si concentra su un software con lo stesso nome che tenta di capire la logistica della costruzione di un ambiente in grado di creare applicazioni di apprendimento automatico ad alte prestazioni che possono essere scalate e create rapidamente. Per i ricercatori che desiderano compilare e manipolare i propri set di dati o cimentarsi con applicazioni di apprendimento automatico, questo software è particolarmente utile. Questo sito consentirà agli utenti di acquisire familiarità con questo software.
Il Progetto Lemur è un database che si concentra sul supporto della ricerca sul recupero di informazioni e sulla gestione delle tecnologie del linguaggio umano. Con pagine web che contano circa 1 miliardo e 10 lingue raccolte da gennaio 2009 a febbraio 2009, l'enorme quantità di materiale presente e di supporto lo rende un'eccellente risorsa per i ricercatori. Tra tutto questo e il supporto aggiuntivo che può essere trovato sul sito, chiunque abbia interesse per la tecnologia e i linguaggi umani avrà molto con cui lavorare su questo sito.
Project Gutenberg è una directory che presenta romanzi, articoli e altri lavori di pubblico dominio. La raccolta di oltre 54.000 eBook del sito spazia da materiali noti come Shakespeare, Mark Twain e Jane Austen a opere meno conosciute di nomi più oscuri come Henri Bergson e Samuel Butler. Che si tratti di prendere un romanzo classico per il gusto di leggere bene o di fare ricerche su come le persone vivevano la vita nel 19° secolo, Project Gutenberg è una risorsa eccellente.
8. Set di dati di milioni di brani
Si tratta di un sito Web che ospita un set di dati completo contenente le funzionalità audio e i metadati di circa 1 milione di brani popolari. Oltre al set di dati principale del milione di brani, c'è anche un numero di set di dati a cui la community ha contribuito in categorie correlate come cover, etichette di genere e testi, tra gli altri. Gli storici della musica, gli hobbisti o i ricercatori che desiderano queste informazioni saranno in grado di ordinare i dati con relativa facilità. Questo potrebbe essere il set di dati più ampio su questo argomento presente su Internet.
9. Amazzonia
Tutti conoscono Amazon come rivenditore digitale, ma sapevi che Amazon ospita anche set di dati pubblici gratuiti a cui chiunque può accedere senza dover archiviare o scaricare nulla sui propri dispositivi? Con dati che spaziano dal meteo, dall'ambiente spaziale e dalle informazioni meteorologiche alle immagini incentrate sullo sviluppo di algoritmi che aiutano la visione artificiale, non mancano le opzioni per coloro che desiderano un modo più conveniente per analizzare enormi quantità di dati.
Nell’interesse di promuovere una maggiore trasparenza, coinvolgere più cittadini e incoraggiare il dialogo, il governo del Canada offre dati estesi come parte della sua iniziativa Open Government. Su questo sito puoi trovare set di dati su questioni legate al governo come i livelli di capacità dei rifugi per senzatetto in Canada, nonché numeri regionali sui livelli di partecipazione degli anglofoni e dei francofoni nel settore pubblico. Con l'accesso a set di dati di questo tipo, non è necessario dipendere dalle statistiche di altre persone per trovare informazioni.
Data Catalogs, ora Data Portals, offre agli utenti un sito conveniente per sfogliare portali di dati aperti da tutto il mondo. Con i portali valutati e curati da vari livelli di governo, da un certo numero di ONG e persino dalla Banca Mondiale, i dati disponibili per l’analisi sono di altissima qualità. Gli utenti hanno la possibilità di navigare o contribuire ai portali di dati. Dal punto di vista della ricerca, la varietà di argomenti e informazioni rende questo sito un luogo particolarmente conveniente per iniziare la ricerca di informazioni.
Data.gov.uk è un sito che consente alle persone di trovare e accedere ai dati pubblicati da vari enti pubblici, dipartimenti governativi, autorità locali e agenzie governative. Qui i ricercatori possono trovare informazioni sul clima economico per le piccole imprese, il commercio, le importazioni, l’industria e le esportazioni o persino fare ricerche sui pagamenti superiori a £ 25.000 effettuati dai dipartimenti governativi. Poiché il sito afferma esplicitamente che i dati possono essere utilizzati per la ricerca, le informazioni qui trattate potrebbero persino generare più idee man mano che i ricercatori le esaminano.
Questo sito è il luogo in cui il governo degli Stati Uniti fornisce dati aperti a cui il pubblico può avere accesso sotto forma di set di dati. Oltre ai dati grezzi, il sito offre anche una serie di strumenti che possono essere utilizzati per effettuare visualizzazioni di dati e creare applicazioni per il web e i dispositivi mobili. Non commettere errori. I dati sono immensi e spaziano dai reclami sulle carte di credito ai dati sui programmi federali di prestito studentesco in oltre 197.000 set di dati. Questo sito offre numerose opportunità di innovazione e analisi complete.
14. DatiSF
DataSF offre centinaia di set di dati relativi sia alla città che alla contea di San Francisco. Sei interessato a vedere cosa hanno spinto i lobbisti locali e regionali? Hai bisogno di statistiche sulla criminalità? Sfoglia la scheda Vetrina per vedere cosa hanno realizzato le persone con i dati o utilizza il modulo per dare un contributo. Realizzato con Open Data e offrendo un'accademia, un blog e una serie di altri strumenti, questo sito è guidato in gran parte dalla collaborazione e dalla comunità. Ciò lo rende una risorsa per il ricercatore.
15. DatiFerrett
DataFerrett è diverso da molti siti in quanto non è un repository o una directory quanto uno strumento che consente agli utenti di personalizzare i dati da fonti locali, statali e federali attraverso l'analisi e l'estrazione dei dati. Questo strumento consente agli utenti di creare fogli di calcolo personalizzati e completi e quindi di trasformare le stesse informazioni in una mappa o un grafico senza dover scaricare o abilitare nessun altro software. Organizzare enormi input di dati e trasformarli in qualcosa di facile da leggere non è mai stato così facile.
16. Infoforo
Attraverso l'Università del Maryland, Inforum rende disponibili al pubblico i dati economici statunitensi. Molte agenzie governative statunitensi hanno contribuito a questo sito al punto che ora il sito contiene migliaia di “serie temporali economiche”, come le chiama, e queste contengono numeri sulla produzione industriale, indici dei prezzi, statistiche sul lavoro e indicatori aziendali. I dati sono liberamente disponibili ed è possibile accedervi sia con un laptop che con un desktop personale. I ricercatori che desiderano osservare attentamente i dati economici grezzi hanno una risorsa in Inforum.
17. Europea
Secondo i dati forniti dal sito, le collezioni di Europeana ammontano complessivamente a oltre 50 milioni di documenti. Utilizzando i set di dati selezionati qui, i ricercatori possono trovare le informazioni che stanno cercando in meno tempo. I set di dati qui includono categorie come modelli 3D, mappe italiane della Prima Guerra Mondiale e persino una raccolta di oltre 20.000 foto storiche provenienti, tra gli altri, dai musei lituani. Per ricerche storiche generali o come punto di partenza per esaminare gli enormi documenti di Europeana, questa è un'eccellente risorsa da avere.
Oltre alla copertura continua delle notizie e degli eventi dell'ultima ora, il Guardian ha anche un'intera sezione dedicata ai trafiletti dei dati. Gli articoli qui spaziano da argomenti seri come l'efficacia delle politiche abitative sui senzatetto ad argomenti leggermente più spensierati come quali paesi hanno il maggior numero di vincitori di premi Nobel. Giornalisti e ricercatori non mancano di informazioni da utilizzare nei propri progetti da questo sito. Con l'aiuto di una ricerca rapida, è possibile trovare dati su qualsiasi cosa.
19. Omnibus dell'espressione genica
Ospitato dal National Center for Biotechnology Information, Gene Expression Omnibus è un sito che contiene "dati genomici funzionali pubblici" conformi agli standard MIAME (Minimum Information About a Microarray Experiment). Il sito accetta anche dati ordinati o sequenziati fornendo gli strumenti necessari per trovare e scaricare le informazioni. Chi è interessato a studiare i genomi o ad acquisire informazioni sull'argomento avrà qui tutti i dati di cui ha bisogno e anche di più.
Riconosciuto da tempo per il suo contributo all'innovazione e al progresso nei campi delle scienze sociali, il Center for Spatial Data Science (CSDS) dell'Università di Chicago esplora la prossima frontiera con la sua incursione nell'analisi e nella tecnologia spaziale. Il lavoro del CSDS ha applicazioni praticamente in ogni campo che deve fare i conti con lo spazio nell'affrontare i problemi. Di conseguenza, campi come l’economia ambientale, la sanità pubblica e la criminologia hanno tutti beneficiato di queste applicazioni. La dedizione di CSDS al software open source e la distribuzione delle sue informazioni rendono i dati forniti ancora più accessibili.
21. Konect
Attraverso l'uso dei dati raccolti dall'Istituto di scienze e tecnologie del web dell'Università di Coblenza-Landau, KONECT (Koblenz Network Collection) offre ricerche condotte nel campo della scienza delle reti e dei suoi argomenti correlati. Il progetto utilizza una serie di propri strumenti software di analisi di rete per elaborare numeri e produrre grafici e algoritmi. KONECT ospita quindi i risultati del proprio lavoro analitico direttamente sul sito web. Con oltre 200 set di dati tra cui scegliere, questa è una risorsa che vale la pena esplorare.
22. MIdati
MIdata è un sito che funge da repository per i dati che dovrebbero essere utilizzati dai dati di machine learning. Questi set di dati possono variare da una raccolta di espressioni facciali umane ad argomenti più scientifici come la previsione di come le molecole si legheranno. Con voci suddivise in categorie che offrono accesso a dati grezzi, tutorial nella sezione materiali e metodi, nonché attività e sfide di apprendimento, questo sito consente ai ricercatori di analizzare l'archivio per i set di dati di interesse.
23. NASDAQ
Il NASDAQ è una borsa di fama mondiale che da tempo rappresenta un'ottima risorsa per giornalisti e ricercatori alla ricerca di dati provenienti dal mondo della finanza e degli affari. Qui troverai informazioni sulle IPO, dati storici sui prezzi e le ultime notizie finanziarie che rendono questo sito una destinazione online di riferimento per i dati finanziari. NASDAQ Composite offre anche opzioni dati a pagamento per coloro che desiderano effettuare un'analisi più approfondita. Questa è una risorsa molto rispettata e consolidata.
24. NASA
Fin dai tempi dello sbarco sulla Luna, ormai tutti hanno sentito parlare di questa agenzia governativa e delle sue incursioni nello spazio. Di interesse per i giornalisti, tuttavia, è il fatto che la NASA sia anche una preziosa fonte di dati attraverso il suo archivio coordinato dei dati sulle scienze spaziali. Qui, i ricercatori sono in grado di trovare dati sulle missioni scientifiche spaziali in categorie come astrofisica, risorse di immagini ed eliofisica, tra le altre. Inoltre, sul sito sono disponibili anche numerosi white paper relativi ai nuovi dati presentati.
Socrata è un sito che prende i dati governativi disponibili e li inserisce in un formato che rende più facile per le persone analizzare, fare clic e trovare le informazioni che stanno cercando. Progettato specificatamente pensando alle esigenze di individui non tecnici come esperti di politiche pubbliche, ricercatori, imprenditori e cittadini preoccupati, Socrata utilizza il cloud per compilare dati da una varietà di fonti. Per i giornalisti che cercano di comprendere l'efficacia delle diverse politiche, questa è una piattaforma utile.
26. Quandl
Quandle è un sito che offre principalmente dati economici e finanziari formattati pensando alle esigenze dei professionisti degli investimenti. Basandosi su oltre 500 fonti di informazione provenienti da organizzazioni credibili come CLS Group, ONU, banche centrali e Zacks, tra gli altri, per aggregare i propri dati, questa fonte di dati è perfetta per ricercatori e giornalisti che vogliono avere il quadro generale a colpo d'occhio. Grazie al componente aggiuntivo Excel del sito, accedere direttamente ai dati non è mai stato così facile anche per gli utenti.
27. Università Carnegie Mellon
La Carnegie Mellon University ha una meritata reputazione come eccellente istituzione accademica. Ciò che molte persone non sanno è che StatLab della Carnegie Mellon è una risorsa utile per i giornalisti in cerca di dati. Questo archivio di set di dati include dati su questioni come gli stipendi MLB dei giocatori nordamericani nel 1986, nonché dati progettati per essere utilizzati nella valutazione dell'accuratezza dei software statistici. In cambio del riconoscimento, questi set di dati sono disponibili per uso pubblico.
28.UCI
L'UC Irvine Machine Learning Repository, denominato UCI, è un sito che memorizza tantissimi dati interessanti che i giornalisti possono utilizzare. Con 394 set di dati al momento della stesura di questo articolo, il sito ha l'ulteriore vantaggio di avere un'interfaccia facile da cercare. Alcuni dei set di dati più popolari includono informazioni sul “Riconoscimento dell’attività umana tramite smartphone”, sul vino e sul marketing bancario, tra gli altri argomenti. In cambio dell'utilizzo di tutti questi dati, il sito chiede semplicemente una citazione.
29. UCR
Se sei un giornalista che sta esaminando lo sviluppo dell'apprendimento automatico, la pagina Classificazione/clustering delle serie temporali dell'UCR sarà un'ottima lettura. Il sito fornisce un utile documento informativo che ti fornirà tutte le informazioni di base che devi sapere. Oltre a una panoramica di ciò che contengono le informazioni, il sito offre anche la possibilità di scaricare direttamente i dati. Ricorda solo di utilizzare il formato di citazione richiesto dal sito se utilizzi questi set di dati.
30. Censimento degli Stati Uniti
Hai bisogno di statistiche sulla ricchezza della popolazione? Vuoi conoscere l'esatta ripartizione per genere di un particolare campo? Il censimento degli Stati Uniti è un sito che dispone di tutti questi dati e di altri disponibili per la visualizzazione pubblica. Ordina i dati per anno o regione e sarai rapidamente in grado di trovare le statistiche che la maggior parte delle persone non sapeva nemmeno fossero prese in considerazione nel censimento degli Stati Uniti così come erano. Questi numeri erano disponibili in Excel e Microsoft Word come opzioni che rendono i dati ancora più accessibili ai giornalisti.
31. Wolfram Alfa
Wolfram Alpha è in realtà un motore computazionale che consente agli utenti di inserire i dati che desiderano conoscere e ricevere un calcolo. Il motore esegue dati e analisi statistici, chimica, date e orari e persino parole e linguistica, tra le altre cose. Per gli utenti che stanno tentando di scoprire nuovi modi di gestire i dati, ciò è particolarmente utile perché è in grado di eseguire nuovi calcoli con la semplice pressione di un pulsante. I giornalisti in particolare trarranno molto vantaggio dall’usarlo come risorsa supplementare.
32. Guaire
Si scopre che Yelp è molto più che semplici ristoranti e recensioni di attività commerciali degli utenti. Questo sito di recensioni gestito dagli utenti conserva anche un set di dati che consente ai ricercatori di accedere a recensioni, dati degli utenti e aziende per “scopi personali, educativi e accademici”. Secondo il conteggio dell'azienda, nel set di dati sono incluse 4,7 milioni di recensioni e 156.000 aziende in 12 aree metropolitane. Con questi numeri, i materiali e le tendenze che i ricercatori potrebbero potenzialmente scoprire in questi dati potrebbero essere una piacevole sorpresa.
33. Mondo dei dati
Vuoi avere un elenco delle pagine Facebook rimosse? Che ne dici di poter ordinare i dati economici degli Stati Uniti per contea? Data World è un sito che consente alle persone di condividere, ospitare, collaborare e tenere traccia dei dati. Il sito include anche una sezione per i giornalisti che illustra i motivi per cui Data World è utile per i membri della professione, sottolineando anche le capacità di hosting per un predittore FOIA semplificato, nonché pagine progettate per aiutare nell'organizzazione. Tutto sommato, questo è un solido mix di dati e hosting di dati.
34. Il libro dei fatti sul mondo
Gestito e gestito dalla CIA, il World Factbook fornisce informazioni sulle strutture sociali, sulla storia, sulle situazioni militari ed economiche di 267 paesi insieme a mappe, bandiere e una serie di fusi orari seguendo i materiali nella mappa del mondo. Il sito offre uno sguardo completo e approfondito sull'argomento in un modo che va oltre le nozioni di base. In breve, questa è una fonte di dati che dovrebbe essere nell'arsenale di ogni giornalista.
35. HealthData.gov
Gestito dal Dipartimento della salute e dei servizi umani degli Stati Uniti, HealthData.gov offre al pubblico l'accesso a "dati sanitari di alto valore" nella speranza di catturare l'attenzione di imprenditori, responsabili politici e ricercatori. Almeno nelle aree dello sviluppo di prodotti e servizi, le persone sono state in grado di esaminare questi dati e ottenere risultati. I giornalisti che vogliono essere aggiornati sui dati sanitari o che stanno esaminando una dichiarazione rilasciata da un funzionario sanitario possono utilizzare questo sito per trovare risposte.
36. UNICEF
Questo è un sito che conferisce credibilità immediata ai giornalisti che utilizzano le informazioni che offre. Le statistiche coperte dall’UNICEF includono quelle relative a questioni di salute e diritti umani come istruzione, salute materna, povertà infantile, acqua e servizi igienico-sanitari e disabilità infantile, oltre a molte altre categorie di statistiche conservate. È utile per i ricercatori perché è aggiornato e supportato da una delle organizzazioni più conosciute del pianeta. I giornalisti non possono sbagliare citando questa fonte di dati.
37. Organizzazione Mondiale della Sanità
L’Organizzazione Mondiale della Sanità è un’organizzazione internazionale che raccoglie statistiche e informazioni sanitarie in tutto il mondo. Oltre alle informazioni che si possono trovare direttamente sulla homepage, il sito offre anche dati attraverso l'Osservatorio Globale sulla Salute. Questi dati includono informazioni sui passi che i paesi stanno intraprendendo verso l’assistenza sanitaria universale, la ricerca e lo sviluppo sanitario, tra le altre categorie. I giornalisti troveranno qui molte informazioni su focolai, emergenze sanitarie e copertura sanitaria in una prospettiva internazionale.
Con la disponibilità di Google Public Data, i giornalisti possono chiaramente fare affidamento su Google in più di un modo. Il colosso del motore di ricerca ha dati pubblici disponibili e disponibili per l'analisi con oltre 100 set di dati pubblici a suo nome. I dati trattati spaziano da quelli estremamente seri con gli indicatori di sviluppo mondiale e gli indicatori di sviluppo umano fino a quelli interessanti con i dati sulle strade più pericolose in Europa. Tutto ciò che un ricercatore deve fare è eseguire una ricerca e vedere cosa hanno i dati pubblici di Google.
Gap Minder offre dati su una serie di indicatori locali e nazionali insieme a collegamenti e informazioni su tutti i fornitori di dati. Usando questo sito i ricercatori possono vedere informazioni come l'età delle donne quando si sposano per la prima volta, statistiche sul consumo di alcol e cause di morte tra i bambini. Per i giornalisti che scrivono con un taglio internazionale o che elaborano dati comparativi, questa è un'ottima risorsa. Questa è una fonte di dati utile a prescindere.
Google Trends è uno strumento che offre ai ricercatori informazioni su ciò che le persone stanno cercando in questo momento. I ricercatori possono confrontare i dati con le tendenze che si sono verificate in passato e possono anche utilizzare lo strumento per fare stime prima, ad esempio, delle festività natalizie, per vedere cosa accadrà alle ricerche in futuro. Google Trends offre grafici, argomenti caldi e tantissime opportunità per scoprire le notizie prima che diventino ufficialmente notizie.
41. Google Finanza
Google Finanza offre un'opportunità semplice e veloce per effettuare una ricerca più approfondita su un'azienda di cui gli investitori sono entusiasti. Modi semplici per filtrare gli indicatori tecnici e rivedere le ultime notizie sull'azienda in un'unica finestra semplice e diretta che ti consente di ordinare ancora di più le informazioni. Inoltre, è gratuito. Per i giornalisti che desiderano effettuare ricerche sulle finanze di una società quotata, Google Finance offre un'interfaccia intuitiva con cui accedere a queste informazioni. Sfortunatamente, Google ha recentemente interrotto alcune delle funzionalità principali come il portafoglio finanziario. Ecco alcune alternative a Google Finanza .
42. DBpedia
Chiunque abbia mai desiderato un modo più semplice per eseguire le ricerche su Wikipedia ha motivo di essere entusiasta di DBpedia. Alimentato dall'impegno della comunità, questo sito cerca di rendere possibile l'esecuzione di ricerche più sofisticate sui contenuti di Wikipedia. Con la versione inglese che vanta 4,58 milioni di voci con classificazioni e categorie associate, il sito è sulla buona strada per offrire una copertura completa basata sulle informazioni presenti su Wikipedia. I giornalisti non possono sbagliare con questa fonte di dati.
43. Pew Research
Per molti, Pew Research è ai vertici per quanto riguarda sondaggi, rapporti e dati di ricerca. Il sito tratta argomenti che spaziano dalle opinioni politiche alle tendenze sociali e agli sviluppi in vari settori lavorativi. Pew Research dispone anche di una funzione di ricerca che rende più semplice che mai l'accesso alle informazioni. I giornalisti che desiderano statistiche e risultati aggiornati provenienti da una fonte affidabile e rispettabile non possono sbagliare rivolgendosi a Pew Research.
44. Istituto ampio
Per i giornalisti che desiderano scoprire le ultime notizie in relazione al cancro, i set di dati del Broad Institute potrebbero essere il luogo perfetto per trovare le informazioni. Ciò include anche informazioni su argomenti aggiuntivi come la bioinformatica e la biologia computazionale, nonché il cancro al cervello e la scoperta di modelli molecolari. In breve, questo sito offre ai giornalisti un vantaggio in termini di ricerca di dati approfonditi sul cancro per creare storie dai dati forniti dal Broad Institute.
45. UNdata
UNdata offre informazioni su diversi paesi del mondo. Ciò include dati come indicatori tecnici, indicatori sociali e indicatori economici per ciascun paese coinvolto. Per i giornalisti che lavorano su storie di interesse umano o su storie che potrebbero trarre vantaggio dall'essere comprovate da alcune statistiche e dati aggiuntivi, UNdata è la scelta ideale. L'accuratezza dei dati e la reputazione delle Nazioni Unite ne fanno una fonte di dati su cui i giornalisti possono contare mentre svolgono ricerche.
46. Google Scholar
Immagina se invece di scorrere i siti web, fosse possibile eseguire una ricerca che non contenga altro che documenti sottoposti a revisione paritaria e materiale accademico. Google Scholar consente alle persone di trovare articoli di riviste, white paper e pubblicazioni dei principali studiosi del mondo. Come di solito accade per questa azienda, Google Scholar è tanto intuitivo quanto basta: all'utente viene semplicemente richiesto di inserire una parola chiave per far girare la palla. La ricerca di documenti accademici non è mai stata così semplice.
47. Reddit
Conosciuto più comunemente come “la prima pagina di Internet”, Reddit è uno dei siti Web più popolari su Internet. Oltre ad essere un indicatore accurato di ciò che accade online, il sito ha anche un subreddit, o un forum secondario, anch'esso dedicato ai set di dati. Gli utenti possono richiedere set di dati, pubblicare risorse e discutere su come lavorare con i dati attraverso formati come JSON. I ricercatori traggono molto vantaggio dall’esaminare questa fonte di dati.
48. Mercato dei dati
Qlik DataMarket consente di raccogliere e gestire dati da fonti esterne. Questa piattaforma consente agli utenti di prendere in prestito diversi set di dati con la possibilità di confrontarli con i dati che già possiedono al fine di affinare il loro senso di contesto più ampio. Meglio ancora, anche se si tratta di una piattaforma a pagamento a seconda dell'argomento, esiste anche un'opzione gratuita con Qlik Datamarket. I giornalisti che esplorano i dati possono farlo a loro piacimento.
49. Hubspot
Hubspot è sempre stato un leader di pensiero nel marketing aziendale. Dal punto di vista della ricerca, questo è un sito che dirà ai ricercatori tutto su ciò che sta accadendo nel settore e ciò di cui parlano le persone nel settore del marketing in questo momento in tempo reale. I giornalisti possono utilizzare questo sito per saperne di più sulle tendenze. In questa nota, Hubspot è una grande risorsa per i ricercatori.
50. Statistiche dell'Ufficio di giustizia
Forse non sorprende che l’Ufficio di Giustizia conservi un sacco di statistiche. Sul sito web dell'Ufficio si possono trovare numeri su arresti, morti di detenuti, esecuzioni con pena capitale, statistiche sulle forze dell'ordine e censimenti delle carceri. Il sistema della giustizia penale è oggetto di costante fascino sia per il pubblico che per le persone ad esso coinvolte. Questo è ciò che rende le statistiche del Bureau of Justice ancora più utili per i giornalisti che stanno facendo ricerche sul sistema della giustizia penale.
51. Rapporto sul crimine uniforme
L'Uniform Crime Report è una raccolta di statistiche sui crimini contro il patrimonio e sui crimini violenti raccolta dall'FBI. Mentre le forze dell'ordine di tutti gli Stati Uniti riportano questi dati dal 1930, i risultati sono stati pubblicati risalenti al 1958 ed è possibile effettuare ricerche nel file . I giornalisti che desiderano esplorare i dati sulla criminalità hanno la possibilità di accedere e utilizzare lo strumento dati UCR per esplorare le informazioni disponibili su questo sito.
52. Reporting uniforme dei crimini
Uniform Crime Reporting è il risultato di un programma ideato dall'Associazione internazionale dei capi di polizia nel 1929. I numeri qui raccolti dall'FBI vengono pubblicati quattro volte all'anno. Oltre alle informazioni fornite dal programma UCR, il sito include anche rapporti sulle statistiche sui crimini ispirati dall’odio, sugli ufficiali delle forze dell’ordine uccisi e aggrediti (LEOKA), nonché sui risultati e sui numeri forniti dal National Incident-Based Reporting System.
53. NACJD
NACJD, o National Archive of Criminal Justice Data, è un sito che trae informazioni da set di dati come Uniform Crime Reports (UCR) e National Crime Victimization Survey (NCVS) e quindi archivia e distribuisce le statistiche. Progettati per essere curati, archiviati e mantenuti per la massima accessibilità, i dati sono disponibili in diverse forme, tra cui sperimentale, qualitativa e longitudinale. In definitiva, questo offre ai giornalisti e ad altri ricercatori un altro modo per visualizzare e accedere alle statistiche sulla giustizia penale.
54. Prima banca dati
First Databank è un sito che si occupa di dati sui farmaci. Il sito mira a promuovere un processo decisionale più efficiente e maggiormente basato sui dati nel settore farmaceutico. Ciò consente a medici e clinici di iniziare a pensare ai farmaci in modo diverso attraverso l'uso innovativo della tecnologia di First Databank. Da un punto di vista professionale, questo sito è particolarmente utile perché i suoi dati possono aiutare i team ad adattarsi man mano che arrivano nuove informazioni. Per lo meno, questa è una risorsa utile per i giornalisti che scrivono nel settore farmaceutico.
55.FDA
La FDA, nota come Food and Drug Administration, è l'agenzia responsabile della protezione della salute pubblica attraverso la supervisione e l'approvazione di farmaci, prodotti alimentari, integratori, vaccini e cosmetici tra gli altri prodotti di consumo. Come risorsa, la FDA mette a disposizione del pubblico set di dati da esaminare, fornendo anche dati tecnici per le persone che si sentono a proprio agio nel lavorare con i fogli di calcolo e nell'analizzare le informazioni provenienti dai set di dati. Questa è sicuramente una risorsa utile per i giornalisti.
Vi siete mai chiesti esattamente quanto paga il Paese in seguito a un’epidemia di droga? Ci sono voci secondo cui le persone consumano droghe in modo diverso rispetto a prima? Drugbase offre un database ricco di statistiche sulle tendenze e sull'uso delle droghe negli Stati Uniti. Sono disponibili infografiche e pubblicazioni su argomenti come la comorbidità tra dipendenza e malattie mentali o fatti sulla guida sotto effetto di sostanze stupefacenti (non ubriache). Questa è una risorsa che fornisce informazioni sufficienti per individuare le tendenze e fare confronti con i dati passati.
57. UNODC
L’UNODC, ovvero l’Ufficio delle Nazioni Unite contro la droga e il crimine, ha un sito web dedicato al raggiungimento del suo obiettivo di aiutare gli stati membri ad adottare standard più rigorosi di ricerca, raccolta dati e attività forense. Su questo sito, i ricercatori possono trovare numerose statistiche e pubblicazioni che trattano argomenti come la raccolta di dati, l’analisi delle tendenze e, ove possibile, programmi di ricerca. Una risorsa ricca di informazioni su una varietà di argomenti legati alla medicina legale e sulla scienza della materia.
58. Fatti della guerra alla droga
Drug War Facts è un sito che offre un'ampia discussione sulla guerra alla droga e sulle conseguenze di questa politica. Ciò include statistiche e numeri su dettagli come confronti tra il costo del trattamento rispetto al costo di fare affidamento sulle forze dell’ordine, numeri sulle stime di spesa per il controllo della droga e una serie di informazioni su quasi tutti gli argomenti legati alla guerra alla droga. Per molte persone, questo è il sito più completo del web riguardo alla guerra alla droga.
59. Centro nazionale per le statistiche sull'istruzione
Il Centro nazionale per le statistiche sull’istruzione, spesso indicato in breve come NCES, è il posto dove andare per tutte le statistiche relative all’istruzione. Questo sito contiene statistiche sullo stato dei prestiti agli studenti, proiezioni delle tendenze dell'istruzione, insieme a set di dati e strumenti di confronto che possono essere utilizzati per effettuare analisi più approfondite. I giornalisti possono utilizzare questa risorsa per scoprire tendenze, verificare dichiarazioni pubbliche, rivedere le pubblicazioni del National Center for Education Statistics e trovare nuove storie nei dati.
60. Banca Mondiale
La Banca Mondiale ospita numerose statistiche e dati compilati dal Development Data Group nel settore finanziario e macroeconomico. È possibile ordinare i dati utilizzando gli hashtag. Gli utenti possono scegliere tra una varietà di indicatori ed effettuare una selezione per paese al fine di esaminare le diverse misure del progresso dello sviluppo. In quanto tale, si tratta di una risorsa a cui chiunque esamini lo stato finanziario e/o economico dei paesi membri può trarre vantaggio dall’avere accesso.
61. Ufficio di statistica del lavoro
Il Bureau of Labor Statistics è la fonte di riferimento dei giornalisti per numeri e statistiche relativi alle attuali condizioni di lavoro, a ciò che sta accadendo nel mercato del lavoro e al modo in cui i prezzi cambiano e influenzano l'economia degli Stati Uniti. Con il lavoro statistico dell'agenzia che risale al 1884, non mancano i dati economici che i ricercatori possono esaminare. Il sito memorizza le informazioni in un'interfaccia intuitiva e aggiorna costantemente i dati disponibili per la ricerca. Questa è una fonte di dati che vale la pena esplorare.
62. I numeri
Le uscite di successo ricevono molta attenzione da parte dei media, ma è difficile dire quanto bene un'azienda abbia effettivamente fatto senza numeri. Inserisci "I Numeri". Questo sito Web offre ricerche e dati per l'industria cinematografica e dell'intrattenimento. I ricercatori possono esplorare le stime dei ricavi, le aspettative per i prossimi rilasci e altri dati sugli investimenti tramite la capacità del motore di ricerca basato su SQL di OpusData. The Numbers è il primo posto da visitare per i ricercatori per ottenere statistiche affidabili su film e pellicole. Questo è ciò che lo rende una risorsa eccellente.
63. Film per sempre
Film Forever è un sito che i ricercatori possono visitare per informazioni di mercato e dati per l'industria cinematografica nel Regno Unito. Qui gli utenti possono trovare i numeri settimanali al botteghino delle 15 migliori uscite del Regno Unito, ricerche sul pubblico, rapporti, casi di studio e l'annuario statistico di punta dell'organizzazione. Inoltre, il sito dispone anche di un calendario che informa gli utenti su quando verranno rilasciate le prossime statistiche. La nicchia di Film Forever lo rende una fonte di dati particolarmente utile.
64. IFPI
IFPI è un sito orgoglioso di avere il polso dell'industria discografica mondiale. Gli utenti troveranno rapporti pubblicati ricchi di approfondimenti sulla musica registrata, dati di vendita nazionali e globali, nonché rapporti sul lato economico dell'industria musicale che mostrano come le aziende stanno investendo nella musica. Questi report consentono agli utenti di vedere cosa sta succedendo. Questo sito manterrà i ricercatori aggiornati su ciò che accade nell'industria musicale in tempo reale.
65. Statista
Statista è un motore di ricerca come Google, solo che al posto delle pagine web il sito restituisce dati e statistiche. Con la semplice pressione di un pulsante, gli utenti possono avere accesso immediato a oltre un milione di statistiche e fatti. Gli utenti troveranno infografiche, statistiche sulla Cina, sull'industria alimentare, sui mercati di consumo e, a pagamento, sono anche disponibili per la visualizzazione dossier e rapporti di settore. Che tu stia cercando informazioni sull'economia, sui social media o sul Big Mac, questo è il posto giusto per farlo.
66. APE
L'EPA, che è l'abbreviazione di Environmental Protection Agency degli Stati Uniti, è l'agenzia governativa responsabile della protezione delle persone e dell'ambiente attraverso l'applicazione delle leggi stabilite e approvate dal Congresso. Sul sito web dell'EPA, gli utenti possono consultare una serie di set di dati su argomenti che vanno dall'agricoltura ad argomenti ristretti come i rilasci annuali di sostanze chimiche tossiche e metodi di gestione dei rifiuti. Questo sito è una scelta eccellente per i giornalisti che desiderano accedere a dati ambientali grezzi.
67. Centri per il controllo e la prevenzione delle malattie
Questo sito web dei Centri per il controllo e la prevenzione delle malattie si presenta come uno “sportello unico per i dati sulla salute pubblica ambientale”. In questo sito, i ricercatori troveranno riferimenti ed elenchi di sistemi di dati che ricevono fondi nazionali mentre monitorano e archiviano informazioni relative a preoccupazioni di salute pubblica ambientale. Con un focus sui programmi che operano a livello nazionale e l'accessibilità attraverso funzionalità di download diretto, questa è una risorsa su cui si può contare per le informazioni più recenti e accurate sul web.
68. Centri nazionali per la salute ambientale
Istituiti dopo la fusione di tre agenzie precedentemente indipendenti, i Centri nazionali per la salute ambientale sono il luogo dove rivolgersi per informazioni di alta qualità sull'ambiente. Offrendo dati completi che vanno dai dati sull'oceano ai record di ghiaccio di milioni di anni fa, se il problema riguarda l'ambiente, è probabile che questo sito contenga informazioni al riguardo. L'impegno dell'agenzia verso l'accuratezza e l'eccellenza nella gestione di uno dei più grandi archivi del suo genere lo rendono anche uno dei pochi siti online che possiede, aggiorna e mantiene questo tipo di dati.
69. Servizio meteorologico nazionale
Il Servizio meteorologico nazionale della National Oceanic and Atmospheric Administration dirà ai ricercatori tutto ciò che devono sapere sul tempo. Questo sito offre ricerche di dati che includono informazioni su categorie come avvisi e previsioni, clima, previsioni geografiche e altro ancora. Inoltre, viene fornito con una mappa intuitiva e facile da seguire con schede su cui è possibile fare clic per ottenere risultati diversi. Che si tratti di rivedere ciò che è accaduto a livello locale o di trovare le previsioni per una città in uno stato diverso, questo sito scoprirà rapidamente le informazioni.
70. Meraviglia
Wunderground è una risorsa dedicata a garantire che le informazioni sul meteo siano disponibili a tutti in tutto il mondo, con attenzione anche alle aree che non ricevono molta copertura. Wunderground dichiara esplicitamente di aver adottato misure per garantire che l'esperienza dell'utente sia eccellente su più piattaforme digitali. Ciò significa che il sito è accessibile sia tramite dispositivi mobili che tramite PC, rendendolo una risorsa ideale per i giornalisti in movimento.
Weatherbase fornisce informazioni sulle condizioni attuali, medie, informazioni sul clima e condizioni di viaggio per oltre 40.000 città in tutto il mondo con l'aiuto di una semplice barra di ricerca. Utilizza il sito associato a cui si collega il sito per trovare ulteriori informazioni di viaggio tra cui convertitori di valuta, coordinate e informazioni sulla contea, oltre ad altri fatti divertenti. Weatherbase può essere utilizzato anche per trovare luoghi in cui trascorrere le vacanze esclusivamente in base alle condizioni meteorologiche. Buona ricerca!
Pubblicato sotto l’egida dell’Agenzia internazionale per l’energia, l’Atlante energetico offre ai ricercatori la capacità di vedere il mondo attraverso le statistiche energetiche. Originariamente progettato per essere una fonte di dati complementare dalla data del suo inizio originale, il sito vanta un bilancio energetico del flusso Sankey animato e diversi database da abbinare alle pubblicazioni che possono essere esaminate nella pagina delle statistiche dell'Agenzia internazionale per l'energia. I ricercatori troveranno sia questo sito che i siti associati estremamente utili durante la ricerca sui modi in cui i paesi e le città utilizzano l'energia.
73. Ufficio di analisi economica
Il Bureau of Economic Analysis, o BEA in breve, pubblica un'ampia gamma di informazioni utili che consentono ai ricercatori di tenere il proverbiale dito sul polso dell'economia nazionale. Su questo sito sono presenti numeri sui conti economici degli Stati Uniti che includono numeri sulla spesa dei consumatori, sul PIL e sulle immobilizzazioni, oltre ad altri dati utili. I ricercatori possono effettuare ricerche per regione o settore, nonché per livello con opzioni di ricerca internazionali, nazionali e regionali. Prova la pagina dati interattiva per saperne di più sull'ufficio.
74. Ufficio nazionale di ricerca economica
Il sito web del National Bureau of Economic Research, o NBER, è una fonte di dati che affronta l’economia da un punto di vista analitico. Ospita dati su un'ampia gamma di argomenti economici con voci come l'indice della governance africana, il ciclo economico ufficiale, la coincidenza sperimentale, gli indici di recessione e di tendenza e il database di storia macro. NBER ha set di dati ufficiali pubblicati e compilati con il proprio nome, nonché indici compilati da altri editori.
75. Commissione per i titoli e gli scambi degli Stati Uniti
La Securities and Exchange Commission degli Stati Uniti è un’agenzia che funge da sorta di cane da guardia nel promuovere la trasparenza, l’equità e l’efficienza nei mercati. È interessante notare che il sito dispone di un set di dati di rendiconti finanziari risalenti a gennaio 2009-ottobre 2017 con aggiornamenti effettuati ogni trimestre. I ricercatori possono fare affidamento su questo sito per rimanere aggiornati sulle ultime notizie relative ai documenti depositati e alle informazioni che può fornire sulle aziende e sullo stato delle loro finanze.
76. FMI
Il Fondo monetario internazionale, noto anche come FMI, è un’organizzazione consolidata nel settore economico e finanziario internazionale. Sul sito web, i ricercatori possono trovare una serie di dati su questi argomenti. Gli utenti possono cercare set di dati per indicatore e paese e sfogliare grafici e mappe mentre effettuano la ricerca. I set di dati più diffusi includono la direzione del commercio, i prezzi delle materie prime primarie, gli indicatori di solidità finanziaria, i sondaggi e le statistiche sulla finanza internazionale, oltre ad altri elementi di informazioni preziose.
Originariamente concepito da Harvard, l'Atlante è uno strumento online che consente alle persone di visualizzare e interagire con la situazione commerciale di un'azienda. Atlas prenderà quindi le informazioni e proporrà diversi prodotti che il paese potrebbe potenzialmente produrre per migliorare la propria economia. Questo è uno strumento utilizzato da politici, uomini d'affari, investitori e membri del pubblico impegnati che desiderano avere una migliore comprensione del clima economico di un determinato paese. Le questioni relative al commercio e alle economie nazionali non sono mai state così accessibili.
78. Fare affari
Doing Business è il risultato di uno sforzo per effettuare valutazioni oggettive delle normative aziendali. Il sito esamina quasi 200 economie e numerose città misurando dettagli quali indicatori economici e classificando la facilità di fare affari. Questo sito consente agli utenti di esaminare gli effetti dei vari tipi di normative commerciali tra paesi e report sugli host, nonché ampi dati qualitativi. Inoltre il sito permette anche di effettuare confronti nel tempo.
79. Compagno
Originariamente un progetto del Dipartimento per le imprese, l'energia e la strategia industriale del Regno Unito in collaborazione con il Dipartimento per il commercio internazionale, Comtrade è un'eccellente risorsa. Prendendo in prestito i dati dai Comtrade Data delle Nazioni Unite, il sito fornisce agli utenti un grafico interattivo che può essere utilizzato per cercare, confrontare e analizzare i numeri esatti del commercio e delle merci tra paesi. Basta selezionare il paese segnalante, scegliere un paese partner ed effettuare il maggior numero di selezioni possibile.
Global Financial Data è una fonte che non si limita a compilare dati finanziari standard, ma richiede informazioni finanziarie risalenti al periodo dal 1200 ad oggi. Queste informazioni provengono da una varietà di fonti tra cui libri, materiali archiviati, riviste accademiche e periodici di notizie. Inoltre, il sito dispone di set di dati che utilizzano il metodo statistico del collegamento a catena. Il risultato finale, dal punto di vista dell'utente, è una risorsa che non ha eguali su Internet in virtù dei suoi dati esclusivi.
81. Visualizzazione dell'economia
Visualizing Economics non è tanto una risorsa nel senso di data discovery del termine quanto piuttosto un servizio incentrato sulla progettazione di grafici informativi e dashboard interattive. Inoltre, Visualizing Economics esegue anche analisi e progettazione con il preciso scopo di rendere i dati economici più facili da comprendere. Attraverso questo sito, i giornalisti hanno la legittima opportunità di lavorare con un professionista che ha anni di esperienza nel tradurre i dati economici in qualcosa di più accessibile al grande pubblico.
Il Portale Open Data dell’UE è un progetto che nasce a seguito di una decisione presa dalla Commissione Europea. Su questo sito, le istituzioni dell'UE offrono dati per la visualizzazione e l'utilizzo pubblico senza restrizioni di copyright e disponibili gratuitamente. I set di dati includono i dati di riferimento CORDIS, il registro per la trasparenza e persino un elenco completo delle persone, delle entità e dei gruppi contro i quali l'UE ha emesso sanzioni finanziarie. Inoltre, i dati sono disponibili in numerosi formati digitali.
83. Rete dati aperta
L'Open Data Network è un sito che consente agli utenti di consultare dati per regione e città. Grazie a una home page chiara e intuitiva sul sito, i ricercatori hanno la possibilità di effettuare ricerche per categoria di dati, città e persino per domande campione. In ogni pagina, dopo aver esaminato le categorie di dati o le domande di esempio, sono presenti collegamenti convenienti anche a ulteriori set di dati. Già solo l'organizzazione dei dati rende l'Open Data Network un sito che vale la pena esplorare.
84. Landmatrix
Landmatrix è un sito che offre un database online per le transazioni immobiliari con l'intento di promuovere una maggiore trasparenza sulle acquisizioni. In sostanza, questo strumento può essere utilizzato per visualizzare e dare un senso ai vari accordi fondiari. I dati sono in continuo miglioramento, cambiamento e aggiustamento al fine di migliorare la precisione delle informazioni rese disponibili. Ad oggi, Landmatrix dispone di informazioni su oltre 1.000 offerte. È una fonte che vale la pena esplorare per i ricercatori.
85. Programma di sviluppo delle Nazioni Unite
Il Programma di sviluppo delle Nazioni Unite ospita molti dati utili sullo sviluppo umano in tutto il mondo che il pubblico può esplorare. Con date che generalmente vanno dal 1990 al 2015 in molti di questi set di dati, gli indici includono tabelle complete come le tendenze dell’indice di sviluppo umano, l’indice di disuguaglianza di genere e il divario di genere nel corso della vita. I ricercatori possono cercare i dati direttamente attraverso la barra di ricerca e anche andare per paese se l’intenzione è quella di consultare il grafico.
86. OCED
L'OCSE, conosciuta come Organizzazione per la cooperazione e lo sviluppo economico, ha un sito che si concentra sull'aiutare i governi nelle iniziative contro la povertà e la prosperità attraverso la stabilità e la crescita economica. In questo sito, i ricercatori troveranno materiali sottoposti a revisione paritaria, pubblicazioni, nonché standard e argomenti a favore della definizione di standard. L’OCSE ospita anche un factbook che fornisce un solido strumento di riferimento economico da abbinare a una serie di sondaggi e previsioni sulle prospettive economiche che si possono trovare sulle sue pagine.
87. Dipartimento della salute e dei servizi umani degli Stati Uniti
Il Dipartimento della salute e dei servizi umani degli Stati Uniti gestisce un sito che fornisce informazioni sul Consiglio presidenziale su fitness, sport e nutrizione. Con fatti e dati raccolti con l'assistenza di numerosi esperti in settori correlati come chef e atleti. Inoltre, il sito ha anche una serie di statistiche. I ricercatori possono trovare dati sull'attività fisica dei bambini, sulle abitudini di rafforzamento muscolare degli adulti, nonché informazioni sulle abitudini alimentari della popolazione, nonché sull'obesità, oltre a numerosi altri fatti e statistiche.
88. Partner nell'accesso alle informazioni per il personale sanitario pubblico
Partners in Information Access for the Public Health Workforce è un progetto nato come risultato di organizzazioni sanitarie pubbliche, agenzie governative statunitensi e biblioteche specializzate in scienze sanitarie. Le pagine tematiche di questo sito includono argomenti quali sovvenzioni e finanziamenti, promozione della salute ed educazione sanitaria, nonché letteratura e linee guida. Attraverso la sezione Argomenti sulla salute pubblica, sono disponibili anche dati su argomenti come il bioterrorismo, la genomica della salute pubblica e la salute pubblica dentale, per citare alcuni argomenti.
89. Fondazione sanitaria unita
Negli ultimi tre decenni, la United Health Foundation ha fornito informazioni sulle classifiche sanitarie da utilizzare come mezzo per misurare la salute pubblica. Il sito ospita numerosi rapporti e pubblicazioni che includono rapporti sulla salute di coloro che hanno prestato servizio, rapporti di anziani, salute di donne e bambini, rapporti annuali e persino resoconti su argomenti importanti sul campo. Utilizza la mappa interattiva per esplorare per regione e ottenere ulteriori informazioni. C'è anche una barra di ricerca per un'ulteriore navigazione se i ricercatori cercano qualcosa di più specifico.
90. Medicare
Negli Stati Uniti, Medicare è il mezzo principale su cui fanno affidamento molte persone per l’assicurazione sanitaria e l’accesso alle cure mediche. Oltre ai servizi offerti in tempo reale, Medicare offre anche dati sugli standard e sulla qualità del trattamento tra strutture e ospedali tramite la sua tabella e regola di confronto. È il set di dati ufficiale utilizzato dal sito web Hospital Compare ed è pieno di dati che possono essere scaricati in Excel per un ulteriore facilità di accesso.
91. Sorveglianza, epidemiologia e risultati finali (SEER)
Surveillance, Epidemiology and End Results, noto anche come SEER, ha un sito particolarmente utile come fonte di informazioni sulle statistiche sul cancro. Ospita riepiloghi statistici che consentono la ricerca sui numeri associati al cancro che possono essere ordinati in base alla sede del cancro, all'etnia, alla razza, all'età, al sesso e persino al tipo di dati. Il sito ospita anche pubblicazioni, set di dati e software che possono essere utilizzati dai ricercatori per analisi ancora più approfondite.
Amnesty International è un'organizzazione che da tempo difende i diritti umani e la giustizia in tutto il mondo. Inoltre ospita molti dati sullo stato dei diritti umani nel mondo, nonché informazioni su specifiche atrocità e crimini contro l’umanità in diversi punti come parte del suo rapporto annuale. I ricercatori possono utilizzare le informazioni per fare confronti tra anni diversi e per vedere come i diversi paesi si sono evoluti o regrediti nel campo dei diritti umani.
93. Gruppo di analisi dei dati sui diritti umani
Fin dalla sua creazione 25 anni fa, il Gruppo di analisi dei dati sui diritti umani ha applicato principi scientifici alle violazioni dei diritti umani in diversi paesi del mondo. Il sito ospita pubblicazioni che sono state pubblicate in media affidabili come il Washington Post e pubblicazioni formali tramite gli editori Macmillan ordinate per anno. Oltre alle pubblicazioni organizzate che risalgono ad anni fa, c'erano anche progetti avvenuti in tutto il mondo. Per uno sguardo più tecnico alle violazioni dei diritti umani, questa è un’ottima ricerca.
94. Relazioni internazionali e dati sui diritti umani
Questo sito ospita database compilati da numerose organizzazioni rispettabili, università e persino agenzie governative. Esempi di questi potrebbero essere il Progetto Manifesto, il Progetto Minoranze (a rischio), il Distretto sugli Stati previdenziali comparati e il Database sui conflitti armati. Ci sono alcuni progetti come il progetto Polity IV che risalgono al 1800. Nel frattempo, progetti come lo Stockholm International Peace Research Institute (SIPRI) misurano i trasferimenti di armi, la spesa militare internazionale e le tendenze in materia di sicurezza. Il modo migliore per apprezzare i dati sarebbe andare sul sito ed esplorare.
95. Programma sui dati sui conflitti di Uppsala
Il Dipartimento per la ricerca sulla pace e sui conflitti di Uppsala, spesso indicato come UCDP, ospita un enorme database chiamato UCDP Concept Encyclopedia. Questo è un sito che consente agli utenti di fare clic ed esplorare i dati che il dipartimento ha già disaggregato. È possibile fare clic sui ricercatori attraverso il sito Web e anche scaricarli per ulteriori manipolazioni e analisi. Si tratta di una risorsa su cui si può contare e a cui si può fare riferimento per informazioni di qualità distribuite in modo accessibile.
96. Dipartimento del Lavoro degli Stati Uniti
Il Dipartimento del Lavoro degli Stati Uniti ospita molti dati economici riguardanti le statistiche sulla disoccupazione e sull’occupazione. Naturalmente, questi numeri includono database che includono statistiche sui licenziamenti di massa, proiezioni sull’occupazione, opportunità di lavoro e turnover sul posto di lavoro, statistiche nazionali sull’occupazione e persino statistiche internazionali sul confronto del lavoro. Il sito fornisce informazioni aggiornate e precise mentre il Dipartimento del lavoro ne tiene traccia. Questa è una risorsa rispettabile con il sostegno del governo a fini di ricerca.
97. Amministrazione delle piccole imprese
La Small Business Administration è da tempo una risorsa comprovata per gli imprenditori e altri aspiranti imprenditori. Questo sito ospita tantissime statistiche sull'occupazione e informazioni che consentono ai ricercatori di effettuare ricerche di mercato e analisi della concorrenza. Qui i ricercatori possono trovare numeri, statistiche e strumenti che possono essere utilizzati per scoprire dati aggiuntivi. Per informazioni sulle statistiche sulle piccole imprese dal punto di vista del datore di lavoro e dell'impresa, questa è un'eccellente risorsa a cui i giornalisti possono rivolgersi in qualsiasi momento.
98. Crowdpac
Crowdpac è una piattaforma che consente ai candidati politici di raccogliere fondi e organizzarsi. Basandosi fortemente sull'idea che ad ogni elezione ci sono un certo numero di candidati al Congresso che praticamente non incontrano opposizione, questo sito consente ai cittadini impegnati di organizzare il sostegno. Con articoli che discutono questioni politiche rilevanti come il gerrymandering, oltre ad argomenti aggiuntivi come i diritti civili e la sicurezza nazionale, questo sito rappresenta un'eccellente opportunità per comprendere e scoprire cosa sta succedendo nella scena politica di base.
99. Gallup
Questo sito ospita i famosi sondaggi Gallup. Gallup è specializzata in analisi che consentono ai decisori organizzativi di risolvere i problemi attraverso un approccio alla risoluzione dei problemi basato sui dati. Inoltre, il dispositivo suggerito da Gallup è spesso utile per soluzioni di guida. Si tratta di una fonte riconosciuta come il gold standard nei dati e nell'analisi avanzata. Basta navigare nel sito per esplorare rapporti su qualsiasi argomento, dallo stato del posto di lavoro globale alla discussione sulla produttività degli Stati Uniti.
100. Biblioteca di Berkeley
La Berkeley Library ospita sul suo sito una raccolta completa di statistiche e dati per la ricerca in scienze politiche. In questa pagina i ricercatori troveranno tantissimi collegamenti che forniscono ai ricercatori l'accesso a una serie di set di dati e la capacità di crearne di propri. Tra questi ci sono la Historical Statistics of the United States (HSUS), la Millennial Edition, il Data Planet, ProQuest Statistical Insight e il Consorzio interuniversitario per la ricerca politica e sociale. Ci sono diverse ore di dati da esaminare.
101. RAND Servizi statali
Per coloro che non lo sanno, la RAND Corporation è un'organizzazione specializzata nella ricerca sulle sfide delle politiche pubbliche. Con clienti e un portafoglio che abbraccia tutti i livelli di governo, la società è una fonte di ricerca di qualità ai fini del processo decisionale. La filiale statunitense della società ospita una serie di statistiche del database sul proprio sito web. Qui i ricercatori possono trovare informazioni su istruzione primaria e secondaria, salute, affari ed economia, oltre ad altre categorie che affrontano questioni rilevanti per il bene pubblico.
102. Centro Roper per la ricerca sull'opinione pubblica
Gestito e gestito attraverso la Cornell University, il Roper Center for Public Opinion Research è specializzato nella raccolta, distribuzione e conservazione dei dati sull'opinione pubblica. Come esempio del tipo di informazioni che il Roper Center può scoprire, i ricercatori possono avere accesso ai dati delle elezioni statunitensi, nonché un collegamento a un archivio di oltre 23.000 set di dati. Sia che i giornalisti stiano cercando la reazione del pubblico alla politica o ad un recente allarme sanitario, questo sito è quasi certo che contenga informazioni.
103. Il governatore dei trasporti
Alimentato e gestito dal Bureau of Transportation, questo sito contiene dati che abbracciano un'ampia gamma di argomenti relativi ai trasporti. Le risorse presenti in questo sito includono rapporti su energia, sicurezza dei passeggeri, energia, prestazioni del sistema, economia dei trasporti, infrastrutture e trasporto merci. Gli utenti possono anche ordinare e accedere ai dati offerti su questo sito per posizione e area geografica. Questo è un sito che consente ai ricercatori di scoprire tutto ciò che potrebbero aspettarsi di sapere sugli argomenti legati ai trasporti.
104. Commercio di viaggi
Travel Trade è un sito che ospita dati relativi alle partenze di cittadini statunitensi dal 1996 al 2016 al momento della stesura di questo articolo. L'obiettivo dichiarato di questa risorsa è aiutare i membri interessati del pubblico in generale a comprendere come il turismo globale e il turismo internazionale hanno funzionato nel corso degli anni. Disponibile sia per il download che per la visualizzazione online, si tratta di un'informazione accessibile. I ricercatori possono facilmente utilizzare questi dati per trovare tendenze e fare confronti.
105. Skift
Skift è un sito che si concentra sulla fornitura di informazioni e dati al settore dei viaggi. Tra le altre fonti di dati, l'azienda ospita ricerche, conferenze e newsletter informative tra cui abbonati e ricercatori possono scegliere. Skift esamina argomenti che gli individui nel settore dei viaggi vorrebbero sapere, come dove le persone viaggiano sempre più, l'identificazione di nuovi mercati e molte informazioni aggiuntive sulla tecnologia dei viaggi che i ricercatori hanno la possibilità di esplorare.
106. Geoba.se
Geoba.se è il sito perfetto per le persone che vogliono i fatti e nient'altro che i fatti su una città o un luogo. Utilizzando il motore di ricerca sulla home page, trovare coordinate, informazioni di viaggio, meteo e persino filmati della webcam locale è solo con pochi semplici tasti. Il sito ospita anche una pagina che fornisce informazioni sulle classifiche mondiali che possono essere ristrette per regione e paese. In breve, questa è una risorsa che fornirà dati e statistiche puri.
107. Viaggio negli Stati Uniti
US Travel ospita un sito gestito e gestito dal Dipartimento di Stato degli Stati Uniti. La missione dichiarata del sito è che mira a proteggere la vita dei cittadini statunitensi che si recano all'estero. In quanto tale, questa fonte ospita statistiche, informazioni e rapporti su argomenti quali passaporti statunitensi, visti statunitensi, adozioni internazionali, morti all'estero e rapimenti internazionali di genitori. Le informazioni possono essere utilizzate durante la pianificazione dei viaggi, ma possono anche essere utilizzate per identificare tendenze a lungo termine con le statistiche che vanno dal 1996 al 2016.
108. Servizio dati del Regno Unito
Finanziata dall'Economic and Social Research Council, la raccolta UK Data Service pubblica un'ampia gamma di dati. Questo sito contiene informazioni che includono materiali come dati aziendali, sondaggi transnazionali, sondaggi sponsorizzati dal governo del Regno Unito e persino dati del censimento del Regno Unito. Fondamentalmente, il sito web è stato progettato pensando alle esigenze di studenti e ricercatori. Inoltre, sono disponibili guide, risorse e materiali didattici che offrono guide e risorse che aiuteranno i ricercatori a comprendere e utilizzare rapidamente gli strumenti di questo sito.
109. Data.gov.au
Gestito e pubblicato dal governo australiano, Data.gov.au offre un facile accesso e ricerca di dati aperti. Questo sito sottolinea esplicitamente che i dati del governo possono essere utilizzati per sviluppare strumenti e applicazioni che a loro volta possono essere utilizzati a vantaggio degli australiani. Non solo viene fornito l'accesso ai set di dati aperti, ma sono anche disponibili dati non pubblicati a cui è possibile accedere a pagamento. Per i ricercatori che desiderano eseguire un'analisi ancora più approfondita, il sito offre anche un Data Toolkit.
110. Twitter
Tutti conoscono Twitter per le sue conversazioni frenetiche, i messaggi brevi e il suo status nella cultura popolare come hub per le ultime notizie. Ciò che molte persone non sanno, tuttavia, è che Twitter dispone anche di strumenti per sviluppatori che semplificano il filtraggio e la scoperta delle informazioni. Questi strumenti consentono anche ai ricercatori di visualizzare le tendenze e filtrare in base alla geografia. Che si tratti di leggere gli hashtag di tendenza o di esplorare gli strumenti per sviluppatori, Twitter è una risorsa che i giornalisti utilizzano da molto tempo.
111. Instagram
Instagram non serve solo per mettere mi piace alle foto di gatti carini e alle foto adorabili di bambini. O almeno, non deve esserlo. L'app dispone di un set sorprendentemente sofisticato di strumenti di sviluppo che semplificano la comprensione e la ricerca sul pubblico. Inoltre, gli hashtag e gli indizi rivelati dalle foto che le persone pubblicano e dalle persone che vengono taggate in esse possono essere un tesoro di informazioni. Instagram è un modo utile per scoprire cosa è di tendenza nei diversi settori.
112. Quattro Quadrati
Per il tipo di ricerca in cui la posizione è importante, Four Square è un'utile fonte di dati grazie al suo enorme database e a tutte le informazioni che ha raccolto. In superficie, ha una guida della città che fornisce consigli agli utenti sulla forza della comunità. Four Square dispone inoltre di strumenti per sviluppatori che consentono l'accesso a ulteriori informazioni tramite il database dei luoghi. I giornalisti possono utilizzarlo per saperne di più su luoghi specifici e sulle persone che utilizzano l'app.
113. New York Times
Considerato da molti uno stimato membro del Quarto Potere, sono pochissimi i giornalisti che non hanno sentito parlare del New York Times. Ciò che spesso viene trascurato, tuttavia, è l'utilizzo del New York Times come fonte di dati attraverso la sua API. I ricercatori possono trovare articoli risalenti al 1851 per mese, cercare articoli e persino trovare recensioni di libri. Questa API consente la ricerca in base a visualizzazioni, condivisioni ed e-mail e persino la ricerca e l'accesso ai commenti.
114. AP
L'Associated Press ha un posto permanente nella cultura popolare come fonte di notizie tempestive e accurate. Grazie ai suoi strumenti di sviluppo, è anche un'utile fonte di dati per i giornalisti. Al momento della stesura di questo documento, i ricercatori possono utilizzare questi strumenti per creare le proprie modifiche durante il download di immagini e video. Il livello dei contenuti sembra dipendere dal tipo di piano utilizzato dai ricercatori, ma l'API dell'Associated Press consente comunque agli utenti di portare il processo di ricerca a un altro livello.
115. Cinque trentotto
I giornalisti potrebbero già avere familiarità con Nate Silver e Five Thirty Eight e il suo modello statistico a causa delle sue previsioni a volte inaspettate ma solitamente corrette. Five Thirty Eight ha un GitHub che ospita set di dati e codici che sono stati utilizzati nel corso della storia del sito. I set di dati presentano argomenti divertenti come i dati sui cattivi guidatori, gli Avengers e il sondaggio sull'etichetta di volo. Allo stesso tempo ci sono anche file che affrontano questioni un po’ più serie come la sicurezza aerea e i crimini d’odio.
116. IMDb
IMDb è considerato da molti il sito più completo del web per quanto riguarda l'industria cinematografica e della recitazione. Se sta uscendo un film e le persone vogliono sapere chi recita o vedere la reazione generale del pubblico che va al cinema, è probabile che finiranno su questo sito ad un certo punto della loro ricerca. IMDb ospita inoltre una serie di set di dati che vengono aggiornati ogni giorno e sono disponibili per uso commerciale e non commerciale.
117. KAPSARC
KAPSARC è un portale dati che ospita un totale di 923 set di dati con informazioni specifiche sui dati energetici. Questi insiemi sono suddivisi in alcuni temi generali riguardanti l'uso dell'energia, l'approvvigionamento energetico e altri fattori rilevanti come le politiche, la demografia, l'ambiente, il commercio, l'acqua e le informazioni economiche. Per i ricercatori interessati all'energia e al suo utilizzo in diversi settori e industrie, KAPSARC è una delle fonti di dati energetici più complete sul web.
118. Macro patrimoniale
Asset Marco è un sito che fornisce dati finanziari storici e indicatori macroeconomici. Questi dati coprono più di 75.000 azioni, valute, materie prime e obbligazioni in tutto il mondo. Inoltre, il sito dispone di oltre 120.000 indicatori macroeconomici che gli utenti possono utilizzare per esplorare i dati finanziari di diversi paesi. Oltre a tutti questi dati sui mercati finanziari, il sito discute anche le strategie di investimento. Questa fonte è davvero unica a causa dell'enorme volume di informazioni che è possibile trovare.
119. Servizi Web del governo statunitense e origini dati XML
I servizi Web del governo statunitense e le origini dati XML sono ospitati su un sito chiamato USGovXML.com. Qui, gli utenti possono navigare tra le diverse fonti di dati XML e servizi web forniti dal governo degli Stati Uniti. Questo semplice atto di conservazione mantiene le fonti web trasparenti e accessibili al pubblico. Per i ricercatori che monitorano regolarmente questo indice in generale, è possibile trovare una storia nei dati nel caso in cui si verifichi un cambiamento improvviso nei dati XML.
120. Figshare
Figshare è un sito che ospita oltre 5.000 contenuti scientifici disponibili per ricerche accademiche e citazioni. Oltre alle informazioni presenti, il sito è progettato per offrire ai ricercatori un'unica posizione allo scopo di compilare, caricare, archiviare e gestire le ricerche che trovano. Matematica, scienze della salute, ingegneria, chimica, scienze biologiche e scienze sociali sono tutte elencate come categorie in primo piano. Questo sito è un'ottima fonte per i giornalisti alla ricerca di ulteriori risorse accademiche da inserire nel sito.
121. Dati collegati
LinkedData è un sito dedicato all'idea di trovare nuovi modi per connettere i dati Internet che prima non erano collegati. Qui gli utenti troveranno tutorial, guide e set di dati che faranno andare avanti la storia. Tutti i set di dati si concentrano sul tema del coinvolgimento nella comunità dei dati collegati e, oltre alla lista della spesa dei dati collegati, la maggior parte è classificata come URI dereferenziabili con o senza il formato RDF complementare. Per saperne di più su questa comunità, questo sito è assolutamente da vedere.
122. Il minatore web
Web Miner è il luogo perfetto per i ricercatori che desiderano raccogliere tutti i dati generici che riescono a trovare con il programma. Questo sito ospita database di esempio come ristoranti statunitensi, codici SWIFT di banche di tutto il mondo, stazioni di servizio statunitensi, attrazioni turistiche americane e app Google Play, oltre ad altri enormi elenchi. Se non altro, è un sito che renderà più facile e veloce per i giornalisti vagliare e scoprire enormi quantità di dati in molto meno tempo.
123. Hub dati
Data Hub è orgoglioso di essere un luogo in cui gli utenti possono trovare e pubblicare dati nel modo più rapido ed efficiente possibile. Il sito stesso ospita una serie di set di dati. L’indice dei prezzi delle case (Case-Shiller), il prezzo mensile dell’oro e le tendenze attuali dell’anidride carbonica atmosferica sono i tre più popolari. Oltre ai dati, il sito ospita anche una serie di tutorial che gli utenti possono seguire per saperne di più sulla navigazione tra i vari tipi di dati disponibili.
124. Enigma pubblico
Sul suo sito, Enigma Public si autodefinisce “la più ampia raccolta di dati pubblici” disponibile sul web. I set di dati rientrano in una delle quattro grandi categorie FOIA, Essentials, Newsworthy e Under the Radar. Alcuni dei dati presenti su questo sito includono gli stipendi dei dipendenti della Casa Bianca e le licenze federali attive per le armi da fuoco. Dopo aver creato un account gratuito, gli utenti possono accedere a qualsiasi categoria di dati disponibili per la visualizzazione.
125. Yahoo
La maggior parte degli utenti web ha familiarità con il nome Yahoo perché Yahoo! Notizie e Yahoo! Finanza tra le numerose proprietà online dell'azienda. Di interesse per ricercatori e giornalisti è il fatto che Yahoo ospita anche un vasto numero di set di dati tra cui Yahoo! Valutazioni degli utenti musicali dei brani con meta informazioni su artista, album e genere, v. 1.0 e Yahoo! Valutazioni degli utenti dei film e informazioni descrittive sul contenuto, v.1.0, per citarne due. I giornalisti alla ricerca di nuove statistiche non possono sbagliare con questa fonte.
126. 1000 genomi
1000 Genomes ospita un progetto con lo stesso nome che è andato dal 2008 al 2015. Lo scopo del progetto era trovare ogni variazione genetica che potesse verificarsi in almeno l'1% delle popolazioni studiate. Insieme alle pubblicazioni nate grazie a questo progetto, c'erano anche enormi set di dati che includevano database separati di cellule varianti, file di sequenze grezze e disponibilità di campioni. Questi dati possono essere consultati o scaricati.
127. CBOE
CBOE è uno scambio di futures che si concentra principalmente sui futures sulla volatilità. In particolare, il sito presenta numerosi materiali riguardanti i futures presenti nel Volatility Index, marchio registrato del sito. Il sito ospita dati di mercato di ogni tipo, inclusi dati storici, statistiche di mercato giornaliere e prezzi di liquidazione giornalieri dei futures VX. Per i giornalisti che cercano dati di mercato di qualità, CBOE è un sito in grado di fornire tali informazioni in un formato facile da seguire e comprendere.
128. Fed di St. Louis
La Federal Reserve Bank di St. Louis è uno dei centri finanziari, se non il più importante, della regione. Sul sito i ricercatori possono consultare direttamente documenti di lavoro, dati economici, pubblicazioni e servizi informativi. In altre parole, non mancano le informazioni sul pensiero attuale e passato della Fed di St. Louis in termini di politica, nonché sulla capacità di valutare l'efficacia della Federal Reserve Bank di St. Louis. Per i giornalisti aziendali, finanziari ed economici, questa è una risorsa di informazione di prim'ordine.
129. OANDA
OANDA è una popolare piattaforma di trading azionario online, che negozia principalmente in CFD e cambi esteri. Oltre alle numerose funzionalità aggiunte al trader con l'intento di attirare trader online, OANDA ospita anche molti dati storici sui tassi e informazioni storiche sul convertitore di valuta sul sito. Insieme a tutti questi dati, il sito offre anche informazioni con strategie di investimento insieme a notizie e analisi di mercato. Non è nemmeno necessario un account per accedere alla maggior parte di questi dati.
130. ABS
L’Ufficio australiano di statistica, o ABS, non diversamente dalla sua controparte americana, offre dati oggettivi, informazioni economiche e ricerche su un’ampia gamma di argomenti rilevanti per il paese. Direttamente sul sito stesso, i ricercatori possono consultare dati statistici su indicatori aziendali, assistenza sanitaria, alloggi, finanza, commercio internazionale, alloggi, salute mentale, nonché indici dei prezzi e inflazione. I giornalisti possono eseguire ricerche per trovare sondaggi e informazioni più vecchi che possono anche ordinare le informazioni per regione.
131. Banca dati di Londra
Originariamente concepito e gestito dalla Greater London Authority, il London Database è il tentativo di Londra di rendere i dati di Londra più accessibili al pubblico. L'obiettivo finale è fornire alle persone l'accesso a queste informazioni incoraggiandole a usarle gratuitamente nel modo che desiderano. Su questo sito Web, gli utenti possono cercare dati per argomenti come arte e cultura, criminalità e sicurezza della comunità, istruzione e salute. I giornalisti interessati a questo tipo di dati ora possono ottenerli direttamente dal governo locale.
132. Statistiche Nuova Zelanda
Il governo della Nuova Zelanda ospita moltissime statistiche e dati che i ricercatori possono approfondire e analizzare su questo sito. Queste informazioni possono essere vagliate utilizzando la barra di ricerca in alto, filtrando per località e regione, oltre che per argomento. Alcuni degli argomenti includono indicatori economici, salute, reddito e lavoro, settori industriali, ambiente e affari. Tra le ulteriori fonti di notizie e i comunicati che mettono in evidenza vari risultati e statistiche, i giornalisti scopriranno tutti i tipi di statistiche specifiche della Nuova Zelanda attraverso questo sito.
133. Ufficio di meteorologia del governo australiano
Gestito e gestito in ultima analisi dal governo australiano, il sito web dell'Australian Bureau of Meterology fornisce informazioni meteorologiche relative alle varie città e regioni dell'Australia. Secondo il sito, questa agenzia è stata istituita come mezzo per aiutare gli australiani ad affrontare il clima che li circonda attraverso una combinazione di avvertimenti e consigli. Qui i ricercatori saranno in grado di trovare prospettive stagionali, stoccaggio dell’acqua, previsioni delle precipitazioni, variabilità climatica e previsioni dei flussi stagionali. In questo sito troverai una copertura accurata e affidabile sul clima australiano.
134. GruppoLens
Questo sito è disponibile sul Web per gentile concessione di GroupLens del Dipartimento di Informatica e Ingegneria dell'Università del Minnesota. Il sito offre pubblicazioni e set di dati a fini di ricerca. Ci sono un totale di circa sei set di dati. Tra i set nominati ce ne sarebbero alcuni intitolati Book-Crossing, MovieLens e HetRec 2011. Insomma, si tratta di una risorsa utile per i giornalisti che cercano di capire meglio come utilizzare i dati forniti.
135. KD Nuggets
KD Nuggets è un sito che si concentra principalmente sulla fornitura alle persone di scienza dei dati, analisi aziendale, apprendimento automatico e data mining. C'è una pagina sul sito che contiene un elenco completo di set di dati che le persone utilizzano per approfondire l'esplorazione del data mining e dei big data con set di dati come Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett e Datamob tutti collegati. Questa è una risorsa fantastica per i giornalisti che preferiscono avere tutte le informazioni in un'unica pagina.
137. Microsoft
Chiunque abbia utilizzato un PC o un laptop avrà probabilmente sentito parlare di Microsoft almeno di sfuggita. È interessante notare che, oltre a PC, laptop e software, Microsoft ospita anche molte ricerche e pubblicazioni. Ciò include innovazioni come il tentativo dell’azienda di creare macchine alfabetizzate e la scienza dei dati basata su cloud. Sono inoltre disponibili informazioni aggiuntive sugli strumenti che Microsoft sta sviluppando come Visual Studio Code Tools e sugli sviluppi nell'intelligenza artificiale che rappresentano.
138. RDataMining
Esattamente come dice sulla scatola, R Datamining è una risorsa su R e datamining. Il sito fornisce numerosi esempi e documenti che forniscono una prospettiva approfondita sul data mining e sul data mining con R. Inoltre, sono presenti anche collegamenti a corsi di formazione come il corso breve offerto dall'Università di Canberra. Ciò include collegamenti a set di dati e presentazioni gratuiti, nonché set di dati che coprono argomenti come dati di aerei, compagnie aeree e rotte, nonché collegamenti a siti come GeoDa.
139. Ricerca collaborativa in neuroscienze computazionali – Condivisione dei dati
La ricerca collaborativa nelle neuroscienze computazionali, nota anche come CRCN, ha una serie di set di dati a cui è possibile accedere tramite il loro sito. I set di dati sono classificati in base alle varie parti del cervello come la corteccia visiva, l'ippocampo, la corteccia motoria, l'aviaria, i movimenti oculari e l'aplysia, solo per fare alcuni esempi. Queste cartelle includono anche sfide, strumenti, simulazioni e metodi. La possibilità di condividere questi dati li rende una risorsa ancora migliore da utilizzare per la ricerca.
140. Archivio della banca dati delle proteine
Secondo il suo sito Web, l'archivio della Protein Data Bank è una risorsa di prima qualità sugli acidi nucleici, le strutture 3D delle proteine e gli assemblaggi complessi dal 1971. Formato con la missione esplicita di mantenere queste informazioni di dominio pubblico, i ricercatori possono andare qui per visualizzare la convalida report e dizionari di dati online. Sono inoltre disponibili statistiche sull'aumento dei dati e sull'utilizzo per l'ordinamento e l'analisi basati sul Web, nonché per il download. Meglio ancora, il sito aggiunge sempre nuove informazioni.
141. Il progetto PubChem
PubChem come progetto ufficiale è stato progettato con lo scopo di informare il pubblico su cosa sono in grado di fare le piccole molecole da un punto di vista biologico. Il sito è collegato a tre database tra cui PubChem Compound, PubChem Substance e PubChem BioAssay. Inoltre il sito permette anche di ricercare le somiglianze tra diverse proteine. Per i ricercatori che portano l'analisi dei dati a un livello superiore, il sito offre anche codifica e suggerimenti gratuiti.
142. Coremine Medical
Coremine Medical è una risorsa inestimabile per chiunque cerchi informazioni su biologia, salute e medicina. Ora che la capacità di text mining biomedico di PubGene è stata implementata nella sua forma attuale, Coremine è anche una delle fonti più flessibili di informazioni biomediche in circolazione. Questo sito mostrerà collegamenti tra concetti e idee in un formato visivamente accattivante e facilmente comprensibile che altrimenti non sarebbe stato notato. È senza dubbio una delle fonti di dati biomedici più complete a disposizione dei giornalisti.
143. Tu Tiempo
Tu Tiempo è un'incredibile fonte di dati meteorologici e climatici per ogni paese del mondo. Utilizzando questa risorsa, è facile trovare le medie annuali, mensili e giornaliere praticamente per ogni città e regione del mondo. Inoltre, gli utenti possono anche effettuare ricerche nel database di oltre 115 milioni di record pieni di dati storici in cui chiunque può effettuare ricerche. A seconda della regione ricercata, è possibile trovare dati che risalgono al 1929.
144. Risorse di rete complesse
Questo è un sito che fornisce l'accesso a una buona parte dei dati utilizzati per la prima volta nei suoi esperimenti basati su computer. L'elenco completo dei set di dati che elencano i tipi di dati inclusi grafici di notizie, grafici biologici, grafici di citazioni, grafici di collaborazione, grafici ingegnerizzati e grafici semantici. La pagina si collega anche a un elenco di fonti che contengono molte informazioni come il set di dati che ha esaminato circa 3 milioni di brevetti statunitensi. La pagina vanta anche un'impressionante raccolta di set di dati di reti complesse.
145. Scopo
Scopus è uno strumento che consente alle persone di trovare rapidamente e facilmente ricerche e citazioni accademiche. Il sito offre un database incredibilmente ampio di ricerche svolte in tutto il mondo in una serie di campi che includono settori come la medicina, la tecnologia, le scienze sociali, le arti e le discipline umanistiche. Utilizza Scopus per acquisire fonti accademiche che potrebbero essere state trascurate. Dopotutto, in molti ambienti, la qualità di una fonte accademica può essere importante quasi quanto le informazioni che fornisce.
146. Stanford
La reputazione di Stanford come prestigiosa istituzione accademica non è nata per caso all'improvviso. L'eccellenza si manifesta nei suoi corsi legati alla programmazione. Il sito ospita anche una serie di set di dati che includono dettagli come informazioni sui social network. Esistono set di dati incentrati sulle cerchie sociali su Facebook, richiesta dell'amministratore di Wikipedia, cerchie sociali di Twitter e Google +. Anche le reti di comunicazione e la rete di prodotti Amazon dispongono di propri set di dati.
147. Università di Milano
Il Dipartimento di Scienze dell'Informazione dell'Università degli Studi di Milano gestisce e gestisce una pagina web nota come Laboratorio per Algoritmi Web. Questo sito ospita numerosi set di dati disponibili per l'esplorazione. Questi includono grafici relativi ai social network, grafici di Facebook, istantanee del progetto DELIS e un breve elenco di dati vari. Le informazioni disponibili qui possono essere visualizzate online e scaricate se lo si desidera, rendendo questo uno dei set di dati più accessibili nel suo genere sul web.
148. Archivio dati della rete UCI
L'UCI Network Data Repository è un sito dedicato ad adottare un approccio scientifico allo studio delle reti. Nella pagina delle risorse, i ricercatori troveranno collegamenti alle directory dei set di dati selezionati da organizzazioni e gruppi di ricerca, nonché da singoli individui. Dispone inoltre di una raccolta di set di dati che verrebbero generalmente utilizzati per l'analisi dei social media. Coloro che scavano nei dati saranno lieti di scoprire che questi set sono disponibili anche per il download.
149. CAIDA
CAIDA, o Center for Applied Internet Data Analysis, raccoglie un'ampia gamma di dati da diverse località, spesso con l'assistenza di diverse organizzazioni e individui. Ci sono set di dati ospitati su questo sito come AS Relationships, DDOS Attacks, Telescope e quelli correlati insieme ad altri dati. Le categorie includono traffico, topologia, sicurezza, riepilogo dei worm e statistiche di riepilogo del traffico. I set di dati possono richiedere l'accesso su richiesta, ma molti, se non la maggior parte, sono pubblici.
150. Crawdad
Crawdad, o Community Resource for Archiving Wireless Data At Dartmouth, è unico perché si concentra sulla fornitura di dati wireless a ricercatori e altri che potrebbero essere interessati all'argomento. Il sito offre una serie di strumenti e l'accesso a numerosi set di dati. Tra i set elencati ci sono quelli relativi all'uso didattico, alla caratterizzazione degli errori di bit, alla diagnosi di rete, alla connettività opportunistica, al calcolo basato sulla posizione e altro ancora da selezionare. I ricercatori apprezzeranno questa risorsa quanto più si immergeranno in essa.
151. Amministrazione statunitense per le informazioni sull'energia
Spesso definita EIA, la US Energy Information Administration si occupa di fornire al pubblico dati annuali sui servizi elettrici. Le informazioni contenute in questi dati riguardano, tra le altre opzioni, le scorte di combustibili fossili, il consumo di carburante, informazioni mensili e annuali sulla produzione di elettricità e dati ambientali. I dati sono lì e disponibili per l’analisi risalenti agli anni dal 2001 al 2017. Tutto ciò che i ricercatori devono fare è navigare nel sito e scaricare le informazioni.
152. Dati oceanografici britannici
Finanziato dal National Environment Research Council, British Oceanographic Data è una delle fonti di dati marini più accessibili su Internet. Con un ampio database che tocca correnti, profili CTD, dati internazionali sul livello del mare, correnti e persino dati storici del registratore della pressione del fondale. Inoltre, nella Libreria dati pubblicati sono presenti set di dati che offrono ulteriore accesso al catalogo. Questa è probabilmente una delle più estese fonti di informazioni marine disponibili online.
153. Reale
Factual fornisce dati sulla posizione per la pubblicità e per l'utilizzo su piattaforme mobili. Di particolare interesse per i ricercatori sono gli strumenti di sviluppo che includono Engine Mobile SDK e le applicazioni professionali e di ricerca complete dell'Observation Graph, nonché dello Stack di convalida locale. Con un soprannome di sito web che sottolinea la passione dell'azienda nel portare dati in tutto il mondo e nel trovare nuovi modi per inserirli nel contesto, Factual ha un chiaro impegno nei confronti dei dati e nella ricerca di opportunità nuove e non ortodosse per utilizzarli.
154. Aree amministrative globali
Aree amministrative globali è un geodatabase che mostra dove sono situate le varie aree amministrative del mondo. I dati raccolti da questo tipo di database vengono poi tipicamente utilizzati nei sistemi informativi geografici. Questi includerebbero paesi e sono ulteriormente suddivisi in province, contee e dipartimenti, tra gli altri. La buona notizia per i giornalisti è che tutti questi dati sono disponibili gratuitamente e possono essere utilizzati anche per uso accademico e generale non commerciale.
155. Geonomi
Geonames è un sito che ospita un database geografico con milioni di voci, caratteristiche uniche e nomi alternativi. Offrendo sia un'opzione di esportazione che l'accesso tramite una varietà di servizi web, questo è un database che elabora circa 150 milioni di richieste ogni giorno. Grazie alle funzionalità wiki del database, gli utenti sono in grado di apportare aggiustamenti e modifiche alle voci del database con relativa facilità. Questa è un'ottima risorsa solo per le funzionalità di hosting multilingue.
156. Dati naturali della Terra
Natural Earth Data è un set di dati cartografici disponibile di pubblico dominio e ricco di informazioni progettato per l'uso in software di creazione di mappe per la creazione di mappe all'avanguardia. Le immagini del prodotto finale sono pulite e ben organizzate e i dati possono essere utilizzati immediatamente. Questo set di dati include la presenza di dati di intelligence e vari temi di dati culturali, raster e fisici vettoriali. Realizzato originariamente pensando alle esigenze e alle preferenze dei cartografi, questo set di dati è utile a chiunque abbia un interesse per la geografia.
157. Mappa di OpenStreet
Openstreet Map non è tanto un sito web quanto più una collaborazione tra utenti che ora fornisce servizi di mappatura ad app, siti e vari dispositivi hardware. Questo sito acquisisce nuovi dati quando gli utenti inseriscono informazioni su punti di riferimento meno conosciuti come stazioni ferroviarie, strade e sentieri. Il dataset completo è disponibile gratuitamente sul sito e può essere scaricato integralmente o parzialmente. Per coloro che scelgono di effettuare un download parziale dei dati, è possibile scaricarli anche per regione.
158. Città di Chicago
La città di Chicago è la sede del campionato Bulls di Michael Jordan e del suo stile unico di pizza, e dispone anche di un proprio portale dati completo. Le categorie di set di dati abbracciano una varietà di argomenti che includono amministrazione e finanza, etica, salute e servizi umani, parchi e attività ricreative, sicurezza pubblica e conservazione storica. In breve, il portale dati della città di Chicago ospita praticamente tutto ciò che potrebbe interessare ricercatori, politici e giornalisti locali.
159. CKAN
CKAN è essenzialmente la sede online del progetto open data della città di Glasgow. Questo sito contiene set di dati su numerosi argomenti che possono essere utilizzati da imprenditori, politici, ricercatori accademici e sviluppatori di app. Dei 360 set di dati ospitati qui, alcuni sono legati alla governance della città, come il set di dati sul patrimonio immobiliare in base al possesso, mentre altri, come il set di dati sulla bicicletta, sono di particolare interesse per i residenti locali. Ci sono tutti i tipi di informazioni qui per i giornalisti che si occupano di un settore più locale.
160. Governo dell'India
Il governo indiano dispone di un sito Web che copre analisi e risorse di dati nella sua versione dell'Open Data Project. Attualmente, sul sito sono presenti circa 137.940 risorse che sono state visualizzate milioni di volte. La stragrande maggioranza di questi file è anche disponibile per il download sul sito. Sia che tu stia cercando numeri sul bilancio pubblico o set di dati che affrontino la salute e il benessere della famiglia, è probabile che questo sito abbia risorse da offrire.
161. Statistiche SA
Questo sito è pieno di statistiche aggiornate, pubblicazioni e dati raccolti dal governo sudafricano. Qui i ricercatori scopriranno informazioni su tutto, dalle indagini su alimenti e bevande agli indicatori economici, statistiche sull'occupazione, numeri della popolazione e importanti statistiche sanitarie. È possibile cercare i numeri per città, tema e indicatore a seconda delle necessità. Questo sito ospita molte informazioni sul censimento e rilascia anche pubblicazioni statistiche, questionari, codici e classificazioni e politica dei prezzi.
162. Sviluppo delle politiche e ricerca
Questo sito è pubblicato sotto l'egida dell'Ufficio per lo sviluppo e la ricerca delle politiche del Dipartimento statunitense per l'edilizia abitativa e lo sviluppo. Pubblica regolarmente ogni anno un gran numero di casi di studio, pubblicazioni semestrali e periodici. Offre inoltre un gran numero di set di dati a cui i giornalisti potrebbero essere interessati: affitti del mercato equo, limiti di reddito, fattori di inflazione per il rinnovo del finanziamento sono solo alcuni dei set a cui il pubblico ha accesso su questo sito.
163. Dati sanitari netti vitali
Presso Vital Net Health Data, i ricercatori troveranno numerosi grandi set di dati relativi alla salute. Questo sito non ospita tanto tutti questi set quanto offre collegamenti a set che le persone possono visitare e attraverso cui trovare informazioni. Questo elenco curato si collega a risorse come CDC Wonder, Eurocat, Health Data All Star e anche al lavoro di organizzazioni di beneficenza come la North American Association of Central Cancer Registries. Questa è senza dubbio una delle risorse di set di dati sanitari più complete disponibili.
164. Ponte analitico
Analytic Bridge è una risorsa dedicata alla business intelligence. Qui i ricercatori troveranno discussioni sull’apprendimento automatico e sull’intelligenza artificiale, collegamenti a webinar e conferenze e persino una scheda per la ricerca di lavoro. Il sito ospita anche Data Science Central, che è la parte del sito che si concentra sui big data. Con la sua comunità attiva e coinvolta e il suo impegno nel fornire notizie e informazioni, i giornalisti interessati alle implicazioni dei dati per le imprese trarranno molto da questo.
165. Archive.org
Conosciuto principalmente per i suoi sforzi volti a diventare una biblioteca pubblica online, archive.org ospita numerose opere pubblicate e una notevole raccolta di set di dati. Il sito vanta i risultati del censimento Internet del 2012, gli archivi del mercato della Dark Net dal 2011 al 2015 e persino un set di dati di commenti pubblici su Reddit. Sono presenti dump di dati da Music Brainz e un set di dati che contiene immagini di copertina audio. Tra le sue pubblicazioni e i suoi dati, archive.org ha molto materiale che i giornalisti possono consultare.
166. Torrenti accademici
Questo sito Web si definisce un sistema progettato per facilitare la condivisione e il download di enormi set di dati. Facendo uso della tecnologia torrent per semplificare la distribuzione dei dati, Academic Torrents è orgoglioso di consentire ai ricercatori di scaricare rapidamente tutto ciò di cui hanno bisogno. Il sito ospita anche documenti, corsi e raccolte da visualizzare. Una rapida ricerca tra le risorse disponibili rivelerà che ci sono tonnellate di set di dati e raccolte disponibili per il download qui.
167. Dataverse
Il modo migliore per avvicinarsi a Dataverse è pensarlo come un altro tipo di libreria. Qui, i ricercatori possono cercare, scoprire e citare i dati con facilità e allo stesso tempo utilizzare questo sito come archivio per le proprie informazioni. L'argomento trattato comprende campi come le scienze sociali, le scienze agrarie, la medicina, la salute e le scienze della vita, nonché le scienze della terra e dell'ambiente. Grandi nomi con pubblicazioni su questo sito includono Gallup e il Dipartimento del Commercio degli Stati Uniti, Bureau of Census, Geography Division.
168. DATI UC
Operando in collaborazione con il Social Science Data Lab dell'UC Berkeley, UC Data è l'archivio più grande e conosciuto dell'università. Questo sito fornisce offerte nei settori della statistica e dei dati delle scienze sociali. Su questo sito i ricercatori possono accedere a documenti, rapporti e documenti di lavoro prodotti dai ricercatori della UC Data. I dati grezzi coprono numerose aree di ricerca che includono assistenza sanitaria, previdenza sociale e previdenza sociale, demografia, voto e informatica, oltre a una serie di altri argomenti.
169. Campo degli scherzi
Joe Kamp offre una guida completa per trovare dati e API sul calcio e sul calcio ai fini dell'analisi dei dati. Se i ricercatori seguono i collegamenti forniti nella pagina, sono disponibili dati open source tramite GitHub, nonché l'accesso ad API gratuite e commerciali ai fini di un accesso più semplice. Poiché i dati e la codifica sono disponibili su un sito noto come GitHub, ottenere questo tipo di dati non è mai stato così facile.
170. Sean Lahmann
Sean Laham non è necessariamente un nome che la gente sente ogni giorno, ma il suo sito ospita una delle statistiche su battuta e lancio più complete e approfondite di Internet. Con numeri che coprono il periodo dal 1871 al 2016, i dati risalgono letteralmente a secoli fa. L'accesso e l'utilizzo dei dati è gratuito ai sensi della licenza Creative Commons Share Alike 3.0 e possono essere scaricati direttamente in SQL e Microsoft Access, solo per citarne alcuni. Le statistiche possono essere scaricate anche tramite GitHub.
171. Foglio retrò
Retro Sheet è una delle fonti più estese su Internet per statistiche e dati sul baseball. Il sito include dettagli come i roster annuali e l'identificazione di arbitri, giocatori e allenatori. Per gli anni in cui erano rilevanti, i dati per l'All-Star Game sono stati inclusi nei file degli eventi insieme a una serie di file degli eventi per la post-stagione e a un piccolo file di discrepanze. Retro Sheet ha anche identificazioni per i ball park per ogni stagione. Che ne dici di approfondito?
Per chi non conoscesse il programma, Hubway è il nome del bike sharing con sede nell'area metropolitana di Boston. Naturalmente, il sistema non ha registrato e rilasciato informazioni identificative, ma Hubway ha comunque le informazioni di base su ogni viaggio effettuato tra luglio 2011 e settembre 2012. Ciò includeva dettagli come l'inizio e la fine del viaggio, nonché la stazione di ritiro per citare alcune categorie.
173. Voli aperti
Open Voli è un database che contiene informazioni su oltre 10.000 terminal di traghetti, aeroporti e stazioni ferroviarie in tutto il mondo. I ricercatori possono trovare la versione .csv compatibile con Excel tramite GitHub e possono anche scaricare i dati direttamente sul sito web. Utilizzando la mappa sulla home page, è possibile vedere quali luoghi specifici sono nell'elenco e il sito arriva addirittura ad avere a disposizione anche informazioni sul percorso. I proprietari del sito possono essere contattati per informazioni ancora più aggiornate.
174. MLVIS
MLVIS è un repository di dati che combina l'analisi visiva con il data mining in tempo reale. Ciò consente di esplorare una comprensione più intuitiva dei dati anche mentre si lavora con set di dati di grandi dimensioni. I dati di benchmark e l'apprendimento automatico dei dati non relazionali insieme a diversi tipi di dati come attribuiti ed eterogenei sono tra le numerose funzionalità e opzioni disponibili attraverso questo sito. Per maggiore comodità degli utenti, queste informazioni possono anche essere scaricate in un unico formato coerente.
Open Data Inception è un sito che offre collegamenti a oltre 2600 portali di dati. Utilizzando la barra di ricerca in alto, i ricercatori possono cercare portali e set di dati per categoria e per tema. Inoltre è possibile utilizzare il sito anche come mezzo per trovare la versione più aggiornata del dataset ricercato. Sfrutta la possibilità di visualizzare i portali dati in formato elenco o in forma visiva interattiva e inizia a trovare i dati necessari.
176. OpenDataSoft
Disponibile in francese, inglese e tedesco, OpenDataSoft è una fonte che offre accesso a 480 milioni di record, 4 milioni di celle API e 9.284 set di dati. Utilizzando la barra di ricerca al centro della home page, i ricercatori possono inserire una parola chiave o una categoria e da lì trovare il set di dati più appropriato. Per i giornalisti, questo è un modo più veloce per trovare i set di dati più rilevanti necessari per completare la ricerca in questione. Visita il sito per saperne di più.
NationMaster è una fonte di dati completi provenienti da oltre 300 paesi, organizzati in oltre 5.000 categorie. I dati coprono numeri che includono numeri sulla percentuale di morti registrati, statistiche sulla Seconda Guerra Mondiale e persino informazioni sulla guerra e sui test nucleari. I ricercatori troveranno anche tabelle, grafici e grafici a torta che consentiranno un'ulteriore visualizzazione dei dati. In parole povere, gli argomenti trattati sono così tanti che c'è sempre qualcosa di nuovo da trovare nei dati.
178. Followerwonk
Twitter è da tempo un popolare sito di social media per le ultime notizie e la ricerca di storie di tendenza. Followerwonk consente agli utenti di portare il proprio utilizzo di Twitter a un livello superiore. Ciò include la ricerca di utenti Twitter con cui connettersi, lo studio dei follower attuali e la pianificazione dell'attività su Twitter per ottenere i massimi risultati. In questi giorni ci sono molti reporter e giornalisti su Twitter che utilizzano il sito per fare networking e diffondere storie. Followerwonk rende gli utenti Twitter più produttivi sul sito.
179. Infochimp
Infochimps è un sito che offre servizi basati su cloud che possono essere ridimensionati allo scopo di ottenere il massimo dai big data. È utile quando si tratta di distribuire e integrare la tecnologia e le applicazioni dei big data. Quando i ricercatori cercano enormi quantità di dati o valutano le tendenze dei big data, questa è una risorsa inestimabile da avere. Sul sito sono inoltre disponibili numerosi white paper e casi che i ricercatori possono visualizzare.
180. Statistiche governative nazionali archiviate
Fondato nel 2006, Archive-It è un servizio fornito da Internet Archive. Questo servizio aiuta le organizzazioni e le aziende a creare raccolte digitali e di conseguenza ha avuto l'opportunità di collaborare con organizzazioni no-profit, college, università e governi. I ricercatori possono effettuare ricerche in alcuni dei diversi archivi presenti sul sito, come i siti Web della corsa ai candidati al Congresso del 2014, gli Archivi di stato dell'Alabama e l'Archivio Web PLN delle informazioni del governo canadese. Questo sito è un tesoro di informazioni per giornalisti intraprendenti.
181. Comuni civici
Civic Commons ha una pagina che elenca le varie iniziative governative sui dati aperti. Questo elenco ricercabile di risorse è organizzato per paese, città, regione e menziona anche le risorse messe a disposizione dalle organizzazioni intergovernative. Per i giornalisti, questo sito rappresenta un modo più veloce per scoprire quali governi stanno partecipando al progetto Open Data. Questo sito garantisce inoltre l'accesso a dati localizzati che non necessariamente emergerebbero in una semplice ricerca su Google.
182. Governi mondiali guardiani
The Guardian è un nome famoso nel mondo del giornalismo per la sua reputazione di emittente delle ultime notizie. Quello che meno le persone capiscono è che il sito ha una sezione che offre dati su e sui governi di tutto il mondo. Ci sono articoli sull’impatto del numero dei senzatetto, discussioni sulla sicurezza informatica e persino discussioni approfondite sul ruolo che i dati e le statistiche devono svolgere nell’attuale clima politico e sociale. La sezione Governo Mondiale del Guardian è in grado di avviare la discussione e trovare spunti per le storie.
183. Dati pubblici aperti (hub)
Questo sito appartiene a un gruppo tramite la Open Knowledge Foundation con l'obiettivo di incoraggiare e sostenere il continuo sviluppo di dati pubblici aperti. Qui gli utenti scopriranno i collegamenti a uno degli elenchi più estesi di cataloghi di dati aperti disponibili. Tra gli obiettivi aggiuntivi menzionati nel sito, il gruppo cerca anche di trovare informazioni su politiche, migliori pratiche e linee guida. Fornisce ai giornalisti un ampio accesso a maggiori e migliori informazioni.
Questo sito web è la sede online del progetto dati aperti offerto dal governo francese. È possibile approfondire i dati effettuando una ricerca per categorie quali occupazione, agricoltura, istruzione, viaggi e turismo. Si tratta di dati che consentono di costruire e sviluppare una comprensione più sfumata di ciò che effettivamente dicono, lasciando allo stesso tempo spazio per confronti basati su informazioni storiche. Fondamentalmente, i giornalisti hanno tutte le ragioni per essere entusiasti di esaminare questi dati.
Questo sito memorizza i dati di ricerca disponibili attraverso l'utilizzo di SourceForge.net da parte dell'Università di Notre Dame. I dati vengono offerti attraverso database relazionali. I dump mensili dei dati consentono inoltre di comprendere meglio il software open source e le sue applicazioni. Per poter accedere a queste informazioni, le richieste di accesso devono essere effettuate per iscritto tramite e-mail. Il problema, tuttavia, è che i ricercatori accademici e accademici sono gli unici idonei ad accedere ai dati.
186. Rapporti sugli UFO
Il National UFO Reporting Center ha un database online che descrive in dettaglio le esperienze delle persone con oggetti volanti non identificati. I ricercatori possono semplificare la ricerca nel database utilizzando una qualsiasi delle quattro categorie: data, forma dell'UFO, data di pubblicazione e persino stato. Gli UFO sono unici perché non mancano mai di catturare l'immaginazione del pubblico. Se di recente si sono verificati incontri del terzo tipo nelle vicinanze, questo è il posto giusto per scoprire cosa hanno detto le persone.
187. WikiLeaks
Noto e famigerato nei media a causa delle controversie e di ciò che le fughe di notizie hanno rivelato sui meccanismi interni del governo e di altre figure famose e potenti della società, WikiLeaks ha una reputazione che lo precede. Sebbene i dump dei dati vengano raramente eliminati in silenzio, nessuno mette mai in dubbio l’accuratezza delle informazioni. Per i giornalisti in cerca di storie che attirino immediatamente l'interesse, WikiLeaks è una fonte comprovata. Se non altro, sarà una lettura interessante.
188. Il Washington Post
Il giornale è già noto come un'eccellente fonte di ultime notizie e articoli di opinione, ma poche persone sanno che il Washington Post garantisce l'accesso ai dati grezzi spesso menzionati nei suoi articoli. Nella pagina dei dati, i ricercatori possono trovare dati in categorie quali istruzione, censimento, salute e sicurezza, trasporti e sviluppo, database storici della Coppa del Mondo e persino numeri relativi al governo e alla politica. In parole povere, avere accesso a questi numeri aiuta le persone a sviluppare una comprensione più concreta dei temi trattati dalle notizie.
189. Dati climatici
Climate Data è un set di dati che fornisce informazioni complete sulla temperatura globale. Nel formato attuale, gli utenti possono vedere ogni informazione importante sul clima attraverso le griglie e allo stesso tempo possono vedere quali sono le medie. Per coloro che cercano i dati complementari, è possibile accedere alle stesse informazioni anche per la terra e l'oceano. Queste informazioni possono essere scaricate, ma per comodità possono anche essere visualizzate direttamente sul sito.
Protein Structure è una fonte che cerca di esaminare come le reti di computer possano essere utilizzate insieme alla biologia. La pagina ospita un repository con dati a cui è possibile accedere tramite i collegamenti forniti. Di particolare interesse per i membri della comunità di ricerca è il modo in cui il sito incorpora diverse idee come l'analisi dei modelli e la biologia eseguibile nel perseguimento di questo obiettivo. Per i giornalisti, vale la pena guardare questo sito per osservare i progressi ed esaminare i dati.
191. Analizza gratuitamente i dati del sondaggio
Con l'aiuto di questo sito, gli utenti possono seguire un corso sull'analisi dei dati del sondaggio senza dover pagare per il privilegio. Analizza gratuitamente i dati del sondaggio con il suo sommario dettagliato, include sezioni con titoli come Mappe e Arte del sondaggio - Manutenzione ponderata, Bilanciamento della riservatezza dei rispondenti con la precisione della stima della varianza, Modelli di equazioni strutturali (SEM) e Dati di sondaggi complessi. Il sito offre un ottimo aggiornamento per coloro che prevedono di gestire più dati statistici in futuro.
192. UCLA
Sul sito wiki dell'UCLA, i ricercatori troveranno una serie di set di dati disponibili a scopo dimostrativo. Sono disponibili numerosi dati simulati e osservati tra cui scegliere. Utilizzando queste risorse è possibile che le persone utilizzino questa risorsa per scoprire dati climatici, dati sulla popolazione, dati biomedici, dati di neuroimaging, dati del censimento statunitense, dati elettorali e dati economici tra numerose altre categorie. In definitiva, questi set di dati sono una risorsa da cui molte persone possono trarre vantaggio.
Sulla pagina del suo sito, l'Università di Toronto offre ai ricercatori l'accesso a quelli che chiama Delve Datasets. Queste raccolte di dati facevano parte di un prodotto più ampio progettato allo scopo di effettuare confronti tra i metodi di apprendimento. In definitiva, queste informazioni servono per lo sviluppo e la valutazione dei diversi approcci all'apprendimento. In breve, si tratta di una solida fonte per i ricercatori che desiderano comprendere meglio come analizzare e gestire i set di dati.
194. Servizio di conservazione delle risorse naturali
Il Natural Resources Conservation Service dispone di un sito che si concentra sulla promozione della conservazione offrendo allo stesso tempo informazioni sui diversi muschi, corna, piante vascolari, licheni ed epatiche presenti negli Stati Uniti. Questo sito ospita un database completo di piante e immagini di piante che possono essere trovate sul sito insieme a tantissime informazioni. I ricercatori possono scaricare il database e trovare tantissime informazioni su argomenti come le colture alternative. In sostanza, questo sito Web contiene tutto ciò che la gente deve sapere sulle piante.
195. Servizio di ricerca agricola
Come si può dedurre dal nome dell'agenzia, questo servizio gestisce le esigenze di ricerca per il Dipartimento dell'Agricoltura degli Stati Uniti. Ogni volta che viene scoperto un problema agricolo, questa è la parte del governo che molto probabilmente ha contribuito a trovare una soluzione. Il sito ospita una serie di set di dati a cui è possibile accedere e scaricare direttamente. Anche i giornalisti possono utilizzare questo sito per trovare tutte le ultime notizie relative alle problematiche che riguardano l'agricoltura.
196. Libreria di immagini di cellule
Questo sito offre una biblioteca pubblica che offre risorse, informazioni e accesso a immagini e animazioni che ritraggono cellule e processi cellulari. La cella è progettata pensando al duplice processo di ricerca e istruzione, le informazioni qui sono quasi sempre rilevanti durante le discussioni sulla salute pubblica e sulle malattie. I materiali provengono da una combinazione di fonti tra cui pubblicazioni storiche e moderne. Per una spiegazione approfondita che semplifica i complicati processi biologici, i giornalisti non possono sbagliare con la Cell Image Library.
197. Genomica completa
Questo è il sito di un'azienda che si considera una parte consolidata dello spazio biotecnologico nel campo del sequenziamento del genoma umano. È interessante notare che Complete Genomics ha reso disponibili al pubblico alcune delle sue sequenze intere di genoma. In definitiva, questo offre tutti i tipi di informazioni utili sul DNA e sul genoma umano sequenziato. L'unica condizione per questo materiale è che i ricercatori che utilizzano queste informazioni si preoccupino di fornire i riferimenti corretti a Complete Genomics.
198. Array espresso
Array Express è un repository che archivia informazioni provenienti dai risultati di esperimenti di genomica che hanno richiesto enormi quantità di sequenziamento o elaborazione. Su questo sito, gli utenti troveranno i risultati di oltre 70.000 esperimenti insieme a più di 2 milioni di saggi all'interno di più terabyte di archivi dati. Meglio ancora, queste informazioni possono essere riutilizzate gratuitamente a fini di ricerca. Si tratta di una grande risorsa per tutte le informazioni più recenti sulla genomica e sui progressi compiuti nel campo.
199. Codificare
L'Enciclopedia degli elementi del DNA, o Consorzio ENCODE, è il risultato di gruppi di ricerca di tutto il mondo che lavorano in collaborazione tra loro. L'obiettivo finale è quello di stilare un elenco di tutte le parti funzionali del genoma che comprenda l'esame approfondito dei livelli di RNA, delle proteine, degli elementi che regolano le cellule e dell'attività dei geni. Ci sono dati che possono essere consultati e un'enciclopedia che offre ulteriori informazioni.
200. Insieme di genomi
Ensemble Genomes è un sito fondato nel 2000 che si occupa dei genomi dei vertebrati. Nel corso degli anni questa risorsa ha aggiunto informazioni complementari su metazoi invertebrati, piante, batteri e funghi. I dati relativi a tutti questi soggetti sono reperibili e consultabili cliccando sui link presenti nel sito. Questo sito contiene tutorial, set di dati su tutti gli argomenti trattati e una raccolta di documenti da sfogliare. Tutti questi fattori rendono Ensemble Genomes una fantastica fonte di dati per i giornalisti.
201. Consorzio per l'ontologia genetica
Gene Ontology è un sito che esiste con il preciso scopo di trovare un modo per rappresentare l'attuale comprensione di come i geni operano tramite computer. Ha numerose pubblicazioni e documentazione aggiuntiva che le persone possono leggere. Ci sono annotazioni ospitate direttamente sul sito. La buona notizia per i ricercatori che vogliono dare un’occhiata più da vicino ai numeri e ai dati grezzi è che ci sono file disponibili per il download direttamente sul sito web.
202. Libreria di firme cellulari integrate basate su rete
Il Centro LINCS della Harvard Medical School esiste allo scopo di aiutare la comunità di ricerca e il pubblico in generale a saperne di più su come reagiscono le cellule umane quando sono state perturbate dai farmaci. Utilizzando il database HMS LINCS e lo strumento Project Explorer, i ricercatori possono trovare pubblicazioni e sintesi dei progetti, nonché risorse generali. I giornalisti possono anche utilizzare questo sito per ottenere tutte le ultime notizie e informazioni che emergono da questa ricerca.
203. Progetto sulla diversità del genoma umano
Il progetto sulla diversità del genoma umano ha fatto molti progressi grazie agli sforzi dello Stanford Human Genome Center. Il sito dispone di campioni con migliaia di campioni e marcatori. Risulta che questi possono essere scaricati, osservati e analizzati a fondo semplicemente seguendo i collegamenti forniti nella pagina. Questa è una grande risorsa per i giornalisti che vogliono comprendere le informazioni provenienti dalla comunità di ricerca.
JCB DataViewer consente a coloro che sono interessati a ciò che ha da dire il Journal of Cell Biology di vedere i dati delle immagini associati agli articoli ivi pubblicati. Il sito ha una galleria completa che le persone possono scorrere per vedere i materiali. Inoltre, gli spettatori hanno anche la possibilità di poter effettuare ulteriori analisi dei dati mentre esaminano il sito. In parole povere, questo sito è perfetto per comprendere i riferimenti e le figure presenti negli articoli della rivista.
205. Portale dei dati Commons sui dati genomici
Il GDC Data Portal è una piattaforma progettata per aiutare i ricercatori e coloro che operano nel campo della bioinformazione a svolgere la ricerca sul cancro in modo più efficiente. C'è un archivio, un'API, nonché documenti disponibili per la lettura e così via. Accedere a questo sito significa poter vedere le stesse informazioni che i ricercatori sul cancro utilizzano per condurre le proprie ricerche. Qui i giornalisti potranno trovare tutti i dati che cercano e anche di più.
206. Aprisp
Opensp è un progetto gestito dalla comunità progettato allo scopo di condividere i genotipi. Le persone che sono state digitate utilizzando FamilyTreeDNA, 23andMe o deCODEme possono caricare tali informazioni sul sito. Lo scopo di chiedere alle persone di farlo è in modo che il sito possa concentrarsi sulla ricerca di connessioni tra genotipi e SNP o polimorfismi a singolo nucleotide. Ciò che è di particolare interesse per i giornalisti è che ci sono dati disponibili che le persone possono scaricare e sfogliare.
207. Guida al percorso
Pathguide è un sito dedicato a fornire informazioni sulle vie metaboliche e di segnalazione, nonché sulle interazioni tra le proteine a livello molecolare. Questa pagina ospita un elenco di circa 697 risorse relative all'argomento principale. I database collegati a questo sito sono generalmente tutti ad accesso libero. La maggior parte dei riferimenti forniti in questo elenco di risorse si concentrano principalmente sull'interazione proteina-proteina. Questo sito è una risorsa inestimabile per gli appassionati di biologia.
208. RCSB PBB
Questo è un sito dedicato a informare gli accademici e il pubblico in generale su tutto ciò che riguarda gli acidi nucleici e le proteine. La banca dati delle proteine RCSB offre accesso a vari strumenti progettati per rendere più comprensibile questo aspetto della biologia, inclusi strumenti di visualizzazione, visualizzazione della struttura 3D e un archivio completamente ricercabile che può essere classificato per categoria di organismi. Inoltre, questo sito offre notizie aggiornate su tutti gli ultimi sviluppi in questo campo.
209. Consorzio di genomica psichiatrica
Lo Psychiatric Genomics Consortium è il risultato della collaborazione tra ricercatori e scienziati di tutto il mondo che lavorano su ricerche riguardanti la componente genetica dei disturbi psichiatrici. Alla fine, questo progetto è stato in grado di produrre 17 documenti principali e altri 31 documenti di sviluppo che offrono analisi e metodi secondari con un unico documento di riferimento che è venuto fuori da tutto questo. Il Consorzio offre strumenti, download e accesso ai risultati tramite il portale di accesso ai dati su richiesta.
210. Pub Chem
PubChem è un nome rispettato nel campo della ricerca medica e biologica e lo è da moltissimo tempo. Offrendo la possibilità di cercare strutture e database di composti, saggi biologici e sostanze, i ricercatori non possono sbagliare con questo sito. Inoltre, in ciascuno di questi database sono presenti milioni di voci. Queste informazioni possono essere visualizzate tramite strumenti come gli strumenti conformatore 3D e gli strumenti BioAssay. I dati sono disponibili anche per il download.
211. COSMICO
Come suggerisce il nome, il Catalogo delle mutazioni somatiche nel cancro, o COSMIC, è dedicato alla cronaca e all’esplorazione degli effetti delle mutazioni somatiche nel cancro. Il sito consente di cercare COSMIC classificato per tipo di cancro, gene e mutazione. Ci sono strumenti su COSMIC come il browser del genoma e il browser del cancro. Inoltre, sul sito sono disponibili per il download anche dati sulla cura genetica, sulla resistenza ai farmaci, sullo screening del genoma, sulle firme mutazionali e sulla cura della fusione genetica.
212. Genomica della sensibilità ai farmaci nel cancro
Il progetto Genomics of Drug Sensitivity in Cancer è dedicato alla ricerca di biomarcatori che possano aiutare i medici a identificare il tipo di farmaco antitumorale a cui i pazienti hanno maggiori probabilità di rispondere. I giornalisti possono utilizzare le schede news per rimanere aggiornati sulla presenza di nuovi dati o modifiche al sito. Inoltre, c'è anche una raccolta di dati sulle linee cellulari, un database che racconta le caratteristiche del cancro e persino un elenco di composti tutti disponibili per la visualizzazione sul sito.
213. Istituto Stowers di ricerca medica
Il sito web dello Stowers Institute for Medical Research offre ai ricercatori del pubblico accesso gratuito ai dati che i suoi scienziati, ricercatori e scienziati di genomica hanno utilizzato per le loro pubblicazioni. Per il pubblico in generale, l’istituto si prende cura di sottolineare che l’accesso allo Stowers Original Data Repository è generalmente gratuito. Detto questo, alcuni dei file più grandi nel database potrebbero non essere accessibili direttamente tramite Internet e potrebbero richiedere soluzioni aggiuntive.
214. Database SSBD
Il database dei sistemi Science of Biological Dynamics, generalmente indicato in breve come database SSBD, fornisce una suite di strumenti e risorse da utilizzare allo scopo di esaminare immagini microscopiche e valutare dati biologici quantitativi. Le immagini trovate su questo sito provengono da una varietà di fonti e includono oggetti come cellule, singole molecole e nuclei di espressione genica. Con i dati su questo sito acquisiti da simulazioni computazionali ed esperimenti, i giornalisti possono essere certi che le informazioni qui vengono costantemente perfezionate e aggiornate.
215. Condivisione di genomi personali
Il Personal Genome Project è un sito incentrato sulla creazione di dati su salute, genoma e caratteristiche che siano aperti e disponibili al pubblico. Continuando in gran parte il progetto con l'assistenza di individui che si sono offerti volontari per rendere pubbliche le proprie informazioni genomiche, questo sito offre gratuitamente al pubblico i dati che ha trovato e acquisito con successo. Scienza a parte, questo progetto offre ai giornalisti uno sguardo interessante sugli effetti della creazione di un registro pubblico delle informazioni sul genoma personale.
216. Browser del genoma dell'UCSC
L'USCS Genome Browser consente alle persone di visualizzare gli insiemi di genomi. Oltre alla visualizzazione online, il sito fornisce anche collegamenti che possono essere utilizzati per scaricare le sequenze e le annotazioni per gli stessi gruppi genomici. Questi collegamenti sono suddivisi nelle categorie di esseri umani, mammiferi, altri vertebrati, deuterostomi, insetti, nematodi, altri genomi e altri download. Anche gli strumenti e le directory presenti su questo sito sono gratuiti per uso personale e non commerciale. I giornalisti possono trarre vantaggio dalla completezza e dall’accessibilità di queste informazioni.
217. UniProt
L'Universal Protein Resource, conosciuto con il nome UniProt, è il posto dove andare per informazioni sul sequenziamento e sull'annotazione delle proteine. Attingendo alle informazioni fornite da tre database negli UniProt Reference Clusters, nell'UniProt Knowledgebase e nell'UniProt Archive, questo sito è dotato, tra le altre funzionalità, di ricerche di peptidi e cluster. I giornalisti possono utilizzare questo sito per verificare, scoprire e apprendere di più sulle nuove scoperte nell'area del sequenziamento e dell'annotazione delle proteine.
218. Dati dell'indice climatico degli attuari
L’Actuaries Climate Index, abbreviato anche ACI, fornisce al pubblico in generale e ai decisori informazioni sulle tendenze climatiche e sugli effetti dei cambiamenti climatici in Canada e negli Stati Uniti. I ricercatori possono esaminare le informazioni fornite da questo strumento educativo per trovare e scoprire enormi cambiamenti nel mare e nel tempo. E' possibile restringere la ricerca per regioni e componenti. Questo sito ha decenni di dati a sua disposizione e aggiorna regolarmente le sue informazioni trimestralmente.
219. Centro meteorologico aeronautico
L'Aviation Weather Center fornisce informazioni accurate, tempestive e aggiornate sulle condizioni meteorologiche su cui può fare affidamento il sistema dello spazio aereo. Su questo sito gli utenti possono visualizzare i vari grafici, previsioni e osservazioni sul tempo inquadrati in modo che gli aviatori possano apprezzarli. È possibile visualizzare in tempo reale le informazioni fornite dalle fonti dati del sito tramite output .csv o XML. I ricercatori possono manipolare e osservare i numeri grezzi più da vicino attraverso questa opzione di download.
220. Unità di ricerca climatica
Il sito web dell'Unità di ricerca climatica è lì con il preciso scopo di svolgere ricerche sugli effetti dei cambiamenti climatici nel passato, studiarne le cause e trovare soluzioni ai problemi dei cambiamenti climatici nel presente. Qui è possibile documentarsi sui risultati della ricerca, avere una panoramica dell'argomento attraverso le schede informative, leggere le pubblicazioni e perfino accedere ai dati grezzi. I giornalisti alla ricerca di set di dati meteorologici grezzi sono fortunati con questa risorsa.
221. Valutazione climatica europea e set di dati
Sul sito web dell'European Climate Assessment & Dataset, il pubblico può scoprire informazioni sui cambiamenti estremi del clima o del tempo. I ricercatori hanno la possibilità di utilizzare lo strumento di ricerca del progetto, chiamato KNMI Climate Explorer, per verificare i dati, esaminare le previsioni stagionali e persino dare un'occhiata più da vicino agli effetti di El Nino tra le altre applicazioni. Poiché questo set di dati viene aggiornato quotidianamente, i giornalisti che utilizzano questa fonte saranno i primi a conoscere eventuali segnali di cambiamento climatico estremo.
222. Servizi di navigazione globale delle immagini
Global Imagery Sfoglia Services, in breve GIBS, è una parte essenziale di EOSDIS nel suo ruolo di fornitore di servizi di immagini reattivi e basati su standard comunitari. In altre parole, GIBS consente alle persone normali di interagire con le immagini satellitari prese praticamente da qualsiasi punto della terra in alta definizione. Dato che EOSDIS GIBS è reso disponibile attraverso i dati delle scienze della Terra della NASA, è più facile che mai per giornalisti e ricercatori saperne di più sul mondo in tempo reale.
223. Clima ed ecosistema di Bering
Gestito dall'Amministrazione nazionale oceanica e atmosferica del governo degli Stati Uniti, questo sito web racconta a giornalisti e ricercatori tutto ciò che potrebbero desiderare di sapere su come il clima e l'ecosistema del Mare di Bering stanno reagendo ai cambiamenti avvenuti nell'Artico. Qui è possibile leggere saggi, rivedere proiezioni e utilizzare lo strumento di dati online per vedere come stanno andando i vari indici climatici, i dati biologici, atmosferici, oceanici e la fauna selvatica nel Mare di Bering.
224. NCEI
Il NCEI, ovvero i Centri nazionali per l'informazione ambientale, è il risultato finale dopo la fusione dei tre data center della National Oceanic and Atmospheric Administration. Questa pagina ospita una serie di collegamenti suddivisi in 22 categorie che collegheranno gli utenti a diverse risorse, pagine di interesse e set di dati climatici e meteorologici. I giornalisti in cerca di informazioni su clima, tempeste, precipitazioni e una miriade di altre preoccupazioni meteorologiche probabilmente troveranno qui quello che stanno cercando.
225. Laboratorio di ricerca sul sistema terra
La Divisione di Monitoraggio Globale della National Oceanic and Atmospheric Administration fornisce informazioni sulle tendenze a lungo termine delle forze del cambiamento climatico sulla terra attraverso il monitoraggio dei principali parametri atmosferici. Tra questi figurano, ad esempio, il monossido di carbonio, il metano, il protossido di azoto e l'anidride carbonica. Questi parametri vengono quindi utilizzati per misurare cose come la riduzione dell’ozono a lungo termine, le fonti e i livelli di anidride carbonica, nonché i pozzi. Questa è una risorsa sul cambiamento climatico che i giornalisti possono utilizzare.
226. WorldClim – Dati climatici globali
Hai mai desiderato un modo migliore per visualizzare i dati climatici? WorldClim è un fornitore di software di dati gratuiti che possono poi essere applicati alla modellazione spaziale e alla creazione di mappe. L'attuale versione di questo software gratuito può essere applicata solo al clima attuale, mentre la vecchia versione consente l'accesso ai dati climatici del passato e del presente e consente inoltre agli utenti di vedere lo stato delle previsioni climatiche future. I giornalisti possono semplicemente seguire il collegamento e scaricare il software.
227. Laboratorio di scoperta della conoscenza
Il Knowledge Discovery Laboratory è un sito dedicato allo sviluppo di tecnologie innovative, alle basi dell'apprendimento automatico e all'applicazione di tale conoscenza in aree pratiche come la scienza delle reti, il rilevamento delle frodi e l'analisi dei dati scientifici. Il sito ospita un set di dati abbastanza considerevole nel DBLP con 1,2 milioni di oggetti e 2,48 milioni di collegamenti inclusi nel set. Per i ricercatori interessati agli obiettivi del Knowledge Discovery Laboratory, questo set di dati è una risorsa eccellente.
228. Sfida di implementazione DIMACS
Il sito web della 9a Sfida di Implementazione ha lo scopo di aiutare i ricercatori a imparare come risolvere i problemi del percorso più breve. Per i creatori, il sito è stato creato con due obiettivi in mente. Innanzitutto, trovare le migliori soluzioni riproducibili. E due, per facilitare la collaborazione tra i ricercatori e la scoperta di soluzioni più efficaci. I ricercatori interessati a vedere quanti progressi sono stati fatti in questo senso possono rivedere i documenti e i set di dati sul sito.
229. Archivio di rete
Il Network Repository è un sito in cui vengono archiviati dati scientifici con l'aggiunta di strumenti visivi interattivi a cui gli utenti possono accedere e analizzare. Questo sito ha la duplice distinzione di essere sia il primo repository del suo genere sia anche il più grande sul web. Utilizzare dati grafici e immagini intuitive e visivamente accattivanti, fare confronti e trovare nuovi modi per contestualizzare i dati è molto più semplice. I giornalisti possono utilizzare questa fonte per trovare storie all'interno dei dati scientifici.
230. Set di dati Pajek
Pajek Datasets è una pagina che fornisce un set di dati che affronta le interazioni tra le proteine presenti nel lievito in erba. Dopo aver offerto una breve spiegazione di base sull'impatto della ricerca di nuovi metodi per rilevare le interazioni insieme ai motivi per cui è essenziale essere in grado di discernere l'importanza delle varie interazioni proteina-proteina, il sito collega gli spettatori direttamente a un set di dati disponibile per il download. Per saperne di più i ricercatori possono cliccare sul link in basso per leggere il paper pubblicato sull'argomento.
231. Dati della rete Mejn
Questo sito cerca di condividere collegamenti ai set di dati di rete che il proprietario del sito web ha utilizzato e compilato. I temi dei set di dati spaziano dal football universitario americano, ai blog politici e ai libri sulla politica americana, ai social network, a Les Miserables e alle collaborazioni sulla teoria delle alte energie. Gli individui interessati ad esplorarli avranno moltissimi temi di set di dati di interesse tra cui scegliere. Inoltre, i dati sono liberamente utilizzabili purché siano presenti riferimenti.
Stanford GraphBase è il nome che è stato dato a una serie di set di dati e programmi da Donald Knuth di Stanford. Se utilizzati in combinazione tra loro, questi programmi e set di dati sono in grado di manipolare e generare grafici e reti. In questo sito i materiali richiesti sono disponibili per il download attraverso i link. In questi file i ricercatori troveranno dati di punteggi di calcio, dati di dizionario, dati che riguardano la ricostruzione della Gioconda e molti altri.
233. Collezione SuiteSparse Matrix
Precedentemente nota come Sparse Matrix Collection dell'Università della Florida, la SuiteSparse Matrix Collection è una raccolta di matrici che hanno implicazioni nella vita reale. Secondo il sito, questa particolare raccolta viene utilizzata il più delle volte per l'algebra lineare numerica nello sviluppo e nel perfezionamento di algoritmi di matrice sparsa. Gli utenti tendono ad apprezzare la raccolta per la sua utilità nell'esecuzione e nel test dei risultati degli esperimenti. I set di dati e i benchmark a matrice sono disponibili per il download direttamente sul sito.
Si tratta di un insieme di set di dati che i creatori di questa pagina Web ritengono essere relazionali o in grado di tradursi bene in una rappresentazione grafica. Graph Datasets offre set di dati come dati Predictive Toxicology Challenge, dati IMDb, dati sulla mutagenesi, dati MovieLens, filtri collaborativi e dati sulle proteine ai ricercatori che vogliono imparare come lavorare con i numeri grezzi. I file sono resi disponibili in questa pagina e possono essere scaricati principalmente in formato XML.
235. Novità sui Big Data
Big Data News è un sito incentrato sui big data e sui fondamenti della scienza dei dati. Questo sito ospita le ultime notizie e include discussioni sull'apprendimento profondo e sull'intelligenza artificiale. Inoltre, Big Data News ospita anche un enorme set di dati che contiene un totale di circa 3,5 miliardi di pagine web. Questi sono tutti separati da livelli denominati rispettivamente grafico a livello di pagina, grafico a livello di sottodominio, grafico di sottodominio di primo livello e grafico a livello di pagamento.
236. Centro per la ricerca su reti e sistemi complessi
CNetS, o il Centro per la ricerca su reti e sistemi complessi, che opera sotto l'egida dell'Indiana University Network Science Institute e della School of Informatics and Computing. Il sito vuole essere una risorsa nei campi della scienza dei dati, delle scienze sociali computazionali e di reti e sistemi complessi con informazioni sull'estrazione mineraria e sui modelli di traffico online. Inoltre, CNetS ospita anche un set di dati contenente circa 53,5 miliardi di richieste di rete effettuate dagli utenti dell'Università dell'Indiana.
237. OONI Esploratore
OONI Explorer, parte dell'Osservatorio Aperto delle Interferenze di Rete, è un progetto dedicato alla fornitura di software gratuito e open source. Gli utenti possono quindi utilizzare il software per provare a bloccare siti Web e app di messaggistica tra le altre applicazioni. Di particolare interesse per le persone interessate a questa tecnologia è la disponibilità di accesso gratuito ai dati grezzi raccolti da OONI. Basta inserire le informazioni in OONI Explorer e interagire con i dati da lì.
238. Sfide nell'apprendimento automatico
Challenges in Machine Learning è dedicato alla ricerca e allo sviluppo dell'apprendimento automatico. In questo sito i lettori troveranno collegamenti a software, libri, sfide di apprendimento automatico, nonché notifiche sui prossimi workshop. Il sito fornisce anche collegamenti a sfide che consentono l'invio successivo alla data. Per i giornalisti interessati a vedere se l'apprendimento automatico può eseguire attività come previsioni finanziarie o classificazione di pagine Web, questo è un sito che merita una visita.
239. DatiX
Attualmente operante sotto l'egida di CrowdANALYTIX, DataX è la parte macchina di un'iniziativa guidata dalla comunità che sfrutta il potere del collettivo per creare applicazioni personalizzate di intelligenza artificiale, apprendimento automatico e programmazione neurolinguistica. Il ruolo di DataX nel processo è la manutenzione e l'implementazione che a loro volta servono a rendere queste soluzioni scalabili. Per i giornalisti che hanno tonnellate di testo, video e dati da esaminare, i bot disponibili tramite CrowdANALYTIX e DataX possono dimezzare i tempi di ricerca.
240. Dati guidati
Driven Data combina il crowdsourcing con la scienza dei dati in un modo che quasi nessun altro sito fa. Sottolineando il suo ruolo nel fornire assistenza alle organizzazioni che stanno affrontando diverse sfide sociali, questo sito offre aiuto mettendo la sua nutrita comunità di data science al lavoro creando modelli statistici che risolvono domande predittive. Sembra che Driven Data funzioni principalmente con le organizzazioni non profit, ma è potenzialmente utile per chiunque abbia dati grezzi da affinare. I giornalisti possono trarre vantaggio dal tenere presente questa fonte.
241. Apri Big Data
Dandelion API è un'applicazione che gestisce l'analisi semantica del testo per i big data. Ciò che questo significa per le persone che hanno dati che richiedono l'elaborazione è che questo programma prenderà testo disorganizzato e troverà un modo per inserirlo nel contesto. I giornalisti che analizzano molti documenti possono sicuramente trarre vantaggio da questa capacità. Dandelion API dispone anche di Open Big Data nelle categorie Milano, Trento ed Europa. Sebbene questa API sia a pagamento, è disponibile una quantità giornaliera di testo che può essere analizzata gratuitamente.
242. Modelli della Terra
Earth Models si concentra sulla condivisione e l'archiviazione di software e set di dati in relazione alla terra. Gli strumenti di modellazione menzionati nel sito includono software di simulazione ed elaborazione, nonché dati virtuali che attingono in larga misura da aree di studio specifiche come la tettonica e la sismologia. Giornalisti e ricercatori che desiderano affinare le proprie conoscenze sull'argomento possono utilizzare le pubblicazioni e gli articoli presenti su questo sito prima di immergersi negli strumenti di modellazione e visualizzazione.
243. Centro dati e applicazioni socioeconomici (SEDAC)
Il Socioeconomic Data and Applications Center, o SEDAC, è uno dei data center associati al sistema EOSDIS della NASA. Su questo sito, i lettori troveranno set di dati che offrono numeri sul cambiamento climatico o informazioni demografiche su griglia. I set di dati possono anche essere ricercati per temi quali governance, agricoltura, uso del territorio, salute, conservazione e clima, acqua, telerilevamento e povertà. Sono presenti mappe, gallerie, guide che forniscono più contesto ai dati e risorse e strumenti aggiuntivi a cui i ricercatori possono accedere anche sul sito.
244. Portale AODN
Il portale AODN, un sito gestito dall'Australian Ocean Data Network, è un sito che offre accesso alla scienza climatica australiana e ai dati marini. I ricercatori che accedono a queste informazioni avranno anche accesso ai dati IMOS e ai metadati, che è un quadro di ricerca supportato da più istituzioni tra cui il governo australiano. I ricercatori che scelgono di sfruttare il portale AODN possono aspettarsi di ricevere un'eccellente consegna dei dati sugli oceani in un'interfaccia intuitiva.
Planet OS offre un framework per big data con un'enfasi sull'energia rinnovabile. Questa scelta di nicchia unita alla competenza del sito lo hanno reso popolare tra le aziende energetiche alla ricerca di nuovi modi per visualizzare e contestualizzare i propri dati. Inoltre, il sito dispone anche del cosiddetto DataHub in cui ospita una raccolta sostanziale di oltre 2.000 set di dati. Questi set di dati includono dati aperti tramite NASA e Copernicus e i dati vengono spesso aggiornati su base regolare.
Lo Smithsonian è da tempo un nome accademico rispettato ed è apprezzato in tutto il mondo per il suo impegno nella ricerca e nella storia. Per certi aspetti è naturale che lo Smithsonian abbia un sito web che offra alcune delle migliori informazioni sulla ricerca sui vulcani online. Il sito pubblica rapporti, collegamenti di ricerca e database che includono ricerche ristrette su vulcani, eruzioni, emissioni e deformazioni da abbinare all'elenco dei vulcani dell'Olocene e al foglio di calcolo. I giornalisti non avranno bisogno di un'altra fonte sull'attività vulcanica.
Aggiornato e gestito dall'Earthquake Hazards Program del governo degli Stati Uniti, il Catalogo dei terremoti consente ai ricercatori di vedere quando e dove si è verificato l'ultimo terremoto. Sebbene i risultati della ricerca siano limitati a 20.000, la ricerca nel catalogo è in grado di filtrare i risultati per grandezza, data e ora e persino per regione geografica. Questo livello di flessibilità rende questa risorsa particolarmente utile per i giornalisti che stanno coprendo un disastro naturale o un terremoto locale e sono alla ricerca di alcune informazioni di base.
248. Associazione economica americana
L’American Economic Association fornisce ai ricercatori dati sui dati macroeconomici per gli Stati Uniti e altri paesi in tutto il mondo. Questo sito non sembra produrre tanto dati economici quanto curare un breve elenco di quelli più affidabili. Tuttavia, alla luce dei numerosi siti che offrono informazioni economiche su Internet, questa è una risorsa dalla quale i giornalisti possono aspettarsi credibilità. Basta andare sul sito e scorrere le categorie di dati economici di conseguenza.
Historicalstatistics.org è un sito incredibilmente utile per trovare il tipo di informazioni economiche che presentano un interessante contrasto con il presente. Ad esempio, il convertitore di valuta storico del sito consente ai ricercatori di scoprire quanto potrebbe comprare oggi una persona con 10 dollari nel 1923. Ospita inoltre pubblicazioni e articoli che pongono domande sui parametri utilizzati nel campo della storia economica insieme a indici di prezzo e informazioni sull'offerta di moneta che possono essere filtrate per paese.
250. Nomiche DB
E se tutti i dati economici pubblici su Internet fossero accessibili e consultabili da un’unica piattaforma navigabile? Db.nomics è un aggregatore di database economici che cerca di fare esattamente questo. I dati sono disponibili in formati come HTML, JSON e CSV e si aggiornano automaticamente mentre le revisioni precedenti vengono archiviate di conseguenza. Le fonti economiche includono la Federal Reserve, il Bureau of Economic Analysis, il Fondo monetario internazionale e altri. I ricercatori alla ricerca di dati economici affidabili non possono sbagliare con Db.nomics.
251. Polo congiunto del debito esterno (JEDH)
Sviluppato attraverso il lavoro congiunto della Banca dei regolamenti internazionali, dell’Organizzazione per la cooperazione e lo sviluppo economico (OCSE), del Fondo monetario internazionale e della Banca mondiale, il Joint Foreign Debt Hub rende accessibili a tutti le informazioni sui dati del debito e sui creditori e debitori internazionali. il pubblico. I giornalisti che esaminano le finanze di diverse nazioni e tentano di comprendere più a fondo il panorama finanziario internazionale troveranno praticamente tutto ciò che vogliono sapere qui.
252. Dati sul commercio internazionale
Elaborata grazie al contributo completo di uno dei maggiori esperti economici come Jon Haveman, questa pagina sui dati sul commercio internazionale ospita dati che possono essere scaricati e ulteriormente analizzati. I set di dati includono dati tariffari, tabelle Penn World, servizi pubblici, dati sulle importazioni, produttività manifatturiera, classificazioni delle merci, codici di differenziazione dei prodotti Rauch, dati NBER, l'indagine sul flusso delle merci del 1997, commercio e immigrazione e il modello di gravità utile. UNIX è il sistema operativo utilizzato per compilarli, ma il sito sottolinea che anche i PC dovrebbero avere accesso ai dati.
253. Imprese aperte
Su OpenCorporates i ricercatori possono permettersi il lusso di cercare e trovare informazioni in uno dei più grandi database aperti di aziende di tutto il mondo. Queste informazioni vengono quindi utilizzate da diversi gruppi in tutto il mondo come banche, investigatori, ONG e giornalisti in uno sforzo di intelligence e informazione. I giornalisti hanno l'ulteriore vantaggio di poter accedere ai dati in tempo reale con l'aiuto dell'API OpenCorproates, nonché tramite i dati principali in blocco o altri set di dati principali.
Our World in Data prende informazioni da una serie di fonti in una varietà di aree e presenta dati quantificati su di esse. Dai numeri sulla partecipazione delle donne alla forza lavoro alle informazioni sulla percezione generale della corruzione nel settore pubblico e sulla disuguaglianza dei redditi globali, se l’argomento può essere discusso in termini di dati, questo sito potrebbe avere una voce a riguardo. I giornalisti possono utilizzare questa fonte per trovare statistiche e numeri relativi a questioni sociali.
255. Scienza Po
Sciences Po, o come è più comunemente noto, l'Institute of Political Studies è una scuola che ha un'innegabile influenza nelle scienze sociali. In questo caso, la pagina di Thierry Mayer include file di dati che presentano dati di regressione sulla gravità e sui conflitti militari da "Make Trade Not War", nonché set di dati sui potenziali di mercato, tra molti altri. I giornalisti che desiderano comprendere meglio le conclusioni raggiunte nelle riviste accademiche scopriranno molte informazioni durante la navigazione in questo sito.
256. Centro per i dati internazionali
Sin dal suo debutto nel 1999, il Center for International Data si è dedicato alla sua missione di raccolta, creazione, miglioramento e distribuzione di dati economici internazionali sia offline che online. Sul sito web, i lettori possono accedere a informazioni come i dati sulle tariffe statunitensi, le importazioni ed esportazioni mondiali e statunitensi e persino le informazioni dalla Penn World Table. Rendendo queste informazioni disponibili al pubblico per l'istruzione e la ricerca, i giornalisti possono accedere e utilizzare questi dati gratuitamente.
257. Osservatorio della Complessità Economica
L'Osservatorio della complessità economica, comunemente indicato come OEC, consente a ricercatori, studenti, economisti e chiunque altro di visualizzare i dati del commercio internazionale. Con i suoi temi accattivanti e l'interfaccia interattiva, questo sito offre ai ricercatori un'opportunità legittima di esplorare le informazioni sul commercio internazionale in modi mai visti prima. Per i giornalisti a cui piace vedere i dati economici prendere vita mentre li cercano, l’OEC è una risorsa inestimabile.
258. Dati della scorecard universitaria
L’istruzione superiore è un argomento scottante in molti ambienti con studenti e famiglie che vogliono sapere come si collocano le scuole e quanto bene stanno imparando gli studenti. Attraverso i dati College Scorecard, il Dipartimento dell'Istruzione degli Stati Uniti fornisce a educatori e studenti tutte queste informazioni e altro ancora. Questi numeri coprono il periodo dal 1996 al 2016 e includono dati attuali, dati di scorecard, guadagni post-scolastici e nuove informazioni sul sistema nazionale di dati sui prestiti agli studenti. È una fonte di istruzione post-secondaria aggiornata che i giornalisti dovrebbero essere sicuri di utilizzare.
259. Set di dati energetici degli edifici commerciali
Essendo un set di dati che si occupa principalmente di energia, COMBED ha automaticamente una pretesa di unicità. Se aggiungiamo il fatto che i suoi dati vengono rinnovati più volte al minuto mentre provengono da un edificio commerciale, diventa chiaro che questo set di dati è unico nel suo genere. Per i giornalisti, queste informazioni sono incredibilmente utili quando preparano un pezzo sul consumo energetico. Accedere ai dati di COMBED è facile come scaricare e aprire un foglio di calcolo Excel.
260. Set di dati DRED
La parte DRED del database DRED sta per Dutch Residential Energy Dataset. Come suggerisce il titolo, questi dati misurano e studiano quanta energia consumerà una singola famiglia olandese. Ambiente, occupazione, elettricità e informazioni generali sulla famiglia sono stati tutti monitorati in questo set di dati dal 5 luglio 2015 al 5 dicembre 2015. Qualsiasi giornalista che effettua ricerche sul consumo energetico trarrebbe vantaggio dal controllare i numeri grezzi forniti qui. Le istruzioni per scaricare i dati in CSV si trovano direttamente sul sito.
261. Set di dati ECO
ECO, che sta per Consumo e Occupazione di Elettricità, è un progetto gestito e gestito dal Distributed Systems Group. La premessa di questo progetto prevedeva che i ricercatori monitorassero i carichi e rilevassero le occupazioni in sei famiglie svizzere nel corso di 8 mesi. Questo sito offre l'accesso a tali informazioni nonché istruzioni e collegamenti a pubblicazioni correlate. Grazie alla dashboard visivamente interattiva del sito, i giornalisti non dovrebbero avere problemi a tradurre la ricerca in qualcosa di coinvolgente.
262. Set di dati indiani per l'acqua e l'energia ambientali
IAWE, che sta per Indian Dataset for Ambient Water and Energy, è stato creato con l'obiettivo di monitorare il consumo energetico di una casa a Nuova Dehli con misurazioni elettriche da elettrodomestici, contatore elettrico e pannello elettrico. A causa di interruzioni, differenze nella fornitura idrica, cadute di pacchetti e fluttuazioni di tensione, iAWE ha riscontrato problemi specifici relativi al monitoraggio del consumo di energia in India. Si tratta di dati incredibilmente utili che i giornalisti possono avere quando discutono i modelli di utilizzo dell’energia.
263. Elettricità a livello di elettrodomestici nel Regno Unito
UK Domestic Appliance-Level Electricity, o UK-DALE, è il nome dato a un set di dati che monitora e registra la quantità di energia richiesta in un gruppo di cinque famiglie. Ogni sei secondi, UK-DALE misura la domanda sia della rete elettrica principale che dei singoli elettrodomestici della casa. I giornalisti interessati a vedere come le famiglie del Regno Unito utilizzano l’energia, possono sicuramente utilizzare UK-DALE. I dati sono accessibili e c'è un documento che descrive il sistema disponibile per la lettura.
264. ArcGIS
ArcGIS Hub è una piattaforma che organizzazioni e individui possono utilizzare per raggiungere obiettivi attraverso iniziative a livello di sito. Con modelli di pagina, guide passo passo ed esempi disponibili per la visualizzazione, questo sito è un'eccellente risorsa per ambiziosi promotori sociali. Nel frattempo, le informazioni disponibili nella scheda Open Data ospitano centinaia di set di dati nella sola categoria “Disastri”. Sia che i giornalisti effettuino ricerche sui dati o li contribuiscano, ArcGIS Hub è utile in più di un modo.
265. CambridgeGIS
Cambridge GIS è il repository di dati aperti della città di Cambridge, Massachusetts. Ad eccezione dei file troppo grandi per essere scaricati tramite questo repository GitHub, la maggior parte dei set di dati della città possono essere trovati in questa pagina. I singoli set di dati qui disponibili includono distretti commerciali, servitù, distretti di zonizzazione, risultati di censimenti, cimiteri e altri punti di riferimento e caratteristiche che possono essere quantificati dai dati. Un giornalista alla ricerca di informazioni locali troverà tutto ciò che sta cercando e altro ancora su questo sito.
266. Geo-Wiki.org
Come risorsa, Geo-Wiki è un sito dedicato a quello che definisce il “movimento scientifico cittadino”. Qui i cittadini sono incoraggiati a cimentarsi nel monitoraggio dell’ambiente. I ricercatori possono trovare le ultime notizie nella barra laterale insieme ai nomi delle pubblicazioni e ai download gratuiti di set di dati e software. Gli strumenti che il sito rende accessibili includono mappe, caricamento di dati personali, convalide e hackathon che possono essere scaricati in formato Excel e file zip.
267. OpenStreetMap
Gli estratti di dati OpenStreetMap provengono dal progetto OpenStreetMap, il tentativo online in corso di creare una mappa del mondo attraverso le modifiche e gli sforzi della comunità globale di utenti. Per iniziare con questa origine dati, tutto ciò che gli editori di contenuti devono fare è scegliere il continente preferito e successivamente trovare il paese preferito. Non sono previsti costi per il download di Geofabrik GmbH e i dati vengono aggiornati quotidianamente come regola generale.
268. Dati aperti HIFLD
Gestito e gestito dal Dipartimento per la sicurezza nazionale, HIFLD, per i dati a livello di base delle infrastrutture nazionali, rende i dati geospaziali di pubblico dominio. Questi dati vengono diffusi con il preciso scopo di fornire supporto e informazioni ai fini della ricerca e della preparazione nella comunità. Questi dati possono essere scaricati in Shapefile e CSV e possono anche essere visualizzati sul web. Per gli editori, HIFLD Open Data rende i dati geospaziali più visivi e coinvolgenti che mai.
269. OpenIndirizzi
OpenAddresses è specializzato nell'infrastruttura e nella raccolta di indirizzi. Alimentato in gran parte grazie agli sforzi della comunità, questo sito utilizza GitHub come piattaforma di sviluppo. Qui, le persone possono posizionare gli indirizzi su una mappa dopo averla aggiunta al database oppure possono prendere i dati e iniziare subito la geocodificazione. Con tutti i dati e gli indirizzi aperti e che richiedono una semplice attribuzione, i regolari aggiornamenti dei dati e il potenziale per i progressi nella geocodificazione rendono OpenAddresses un progetto molto interessante.
270. Open Data LMU
Open Data LMU fa molto affidamento sui dati di OpenStreetMap per aiutare nello sviluppo del Fast Reverse Geocoder. Ciò significa che l'applicazione è in grado di individuare rapidamente una posizione su una mappa e trovare un indirizzo completo in base a quel punto. Questo potrebbe potenzialmente essere applicato anche ai quartieri e alle contee. Questa pagina Web ospita una serie di collegamenti relativi all'applicazione che includono codice sorgente, set di dati e tabelle di ricerca e risoluzioni di OpenStreetMap.
271. Esploratore di dati ambientali
Con Environmental Data Explorer, giornalisti, ricercatori e studenti possono scaricare ed esplorare gli stessi set di dati utilizzati dal Programma ambientale delle Nazioni Unite insieme alle sue organizzazioni e partner affiliati. Le ricerche possono essere ristrette per regione ed effettuate utilizzando uno o tutti i 500 filtri. Inoltre, i set di dati includono categorie come salute, PIL, clima, emissioni e acqua dolce che possono essere visualizzate direttamente sul sito sotto forma di grafico, tabella o mappa.
272. Gruppo della Banca africana di sviluppo
Il sito del Gruppo della Banca Africana per lo Sviluppo è la prima tappa di un giornalista quando cerca informazioni statistiche e indicatori relativi al continente africano. Gli utenti che scorrono il catalogo dati possono filtrare i set di dati per origine, argomento e regione. Per chiunque sia alla ricerca di una conoscenza più approfondita dell’argomento in questione, il sito offre anche collegamenti a un impressionante elenco di pubblicazioni che includono titoli come African Economic Outlook e African Statistical Yearbook.
273. Dati genomici comuni (GDC)
Genomic Data Commons dell'NCI ospita uno degli archivi di dati sul cancro più completi sul web, incentrato sull'area degli studi genomici sul cancro. Il portale dati di questo sito ospita migliaia di casi e copre 38 tipi di malattie insieme a 39 progetti ed è ad accesso gratuito. Poiché i dati inviati vengono inviati principalmente da istituzioni e ricercatori, l'accuratezza di queste informazioni ne fa una fonte di dati ideale da tenere sempre a portata di mano per i giornalisti.
I database di PhysioBank rendono i dati fisiologici disponibili agli individui tramite il pubblico dominio. Questi database sono divisi in due categorie più grandi: forme d'onda e cliniche. Tra le sottocategorie delle forme d'onda sono presenti database di immagini, intervalli interbattiti, database sintetici, andatura ed equilibrio, ECG e multiparametrici. Un assaggio delle informazioni pure che ne escono includono dati sui segni vitali al capezzale, sulla saturazione di ossigeno e persino sulle malattie cardiovascolari. Giornalisti e individui che effettuano ricerche sul corpo umano possono trovare alcune informazioni qui.
275. Database della copertura Medicare
Il database Medicare Coverage, gestito dai Centers for Medicare & Medicaid Services attraverso il Department of Health and Human Services, offre ai ricercatori pieno accesso a moltissime informazioni sui servizi medici. Ci sono informazioni sulle malattie croniche, sulla spesa farmaceutica, sui modelli clinici elettronici, sul sistema di recupero crediti e sui finanziamenti per la ricerca e la dimostrazione per documentarsi al riguardo. Per i dati presi direttamente dalla fonte, questo è il sito online più approfondito e completo nel suo genere.
Contenuti dei nostri partner
276. Dati aperti sui pagamenti
Quando la maggior parte delle persone va dal medico, in genere non si siede a pensare se il proprio medico di base tragga o meno dei benefici finanziari dopo aver lavorato con i produttori di servizi sanitari. Open Payments informa il pubblico su eventuali pasti, ricerche, regali, compensi per conferenze e spese di viaggio che il medico o l'ospedale ha ricevuto dalle aziende. I giornalisti alla ricerca di una storia incisiva possono utilizzare l'esploratore dati per visualizzare le informazioni o fare clic sulla scheda per scaricare direttamente i dati.
277. FlickrLogos
È parzialmente scritto nel nome, ma FlickrLogos si riferisce a un set di dati costituito da loghi aziendali fotografati in una varietà di posizioni diverse. Gestita dal Multimedia Computing and Computer Vision Lab dell'Università di Augusta, questa raccolta è stata originariamente compilata con l'intento di addestrare i computer a riconoscere logo e testo. Per rimanere al passo con i progressi compiuti con questo programma degno di nota, non può far male scaricare questo set di dati e vedere di cosa si tratta.
278. ImageNet
ImageNet è un database pieno di immagini organizzate da WordNet. Sul sito sono presenti sfide annuali che possono essere visualizzate anche dopo la chiusura e sono incentrate sulla creazione di algoritmi in grado di eseguire compiti specifici. ImageNet ospita anche numerose pubblicazioni, citazioni e diapositive. Gli editori di contenuti orientati alla tecnologia avrebbero tutte le ragioni per utilizzare l'opzione Explorer per dare un senso alla struttura di WordNet e alla mappa cloud.
279. Set di dati sui cani di Stanford
Il set di dati Stanford Dogs contiene tonnellate di immagini e immagini di diverse razze di cani. Con 120 diverse razze di cani incluse insieme a oltre 20.000 immagini individuali, questo database basato su ImageNet offre ai ricercatori numerose immagini con cui lavorare mentre insegna alle macchine come riconoscere ciascuna razza di cane. Sul sito è possibile fare clic su collegamenti a diverse pubblicazioni che discutono dell'uso dei set di dati per insegnare ai computer il riconoscimento delle immagini e leggerli insieme al download del set di dati.
280. Banca dati del SOLE
Il database SUN è il sito di un progetto messo insieme affinché la comunità di ricerca possa fare passi da gigante in settori quali la visione artificiale e la grafica, il data mining, l'apprendimento automatico e le neuroscienze, tra gli altri. Con oltre 131.000 immagini e quasi 4.000 categorie di oggetti nei suoi indici, questo sito è il più completo possibile. Per gli editori interessati a questo database e a ciò che i ricercatori sono stati in grado di fare durante l'utilizzo, questa è una fonte di dati che vale la pena esplorare.
281. Il set di dati sugli animali domestici Oxford-IIIT
L'Oxford-IIIT Pet Dataset è un sito che funge da complemento a un articolo pubblicato alla conferenza IEEE del 2012 sulla visione artificiale e il riconoscimento dei modelli e ospita il set di dati originale utilizzato per gli scopi dell'articolo. Queste immagini sono state organizzate in circa 37 categorie di animali domestici da abbinare ad altre 200 immagini associate a ciascuna classe coinvolta. Inoltre questi dati possono essere scaricati direttamente attraverso i link presenti nella pagina web.
282. Il set di dati del genoma visivo
L'API Visual Genome è il risultato finale del duro lavoro svolto da diversi studenti e professori associati dell'Università di Stanford. Con diversi documenti a suo nome nel tentativo di creare un'API in grado di valutare e descrivere le immagini, il programma ha risposto con successo a oltre un milione di domande valutando oltre 100.000 immagini. Questa API rappresenta il progresso nel campo dell'informatica e dei campi correlati e il set di dati può essere scaricato direttamente sul sito.
283. Facce di YouTube
Il database dei volti di YouTube si concentra sullo sviluppo di una soluzione al problema del riconoscimento facciale automatico nei video. Complessivamente, il set di dati comprende oltre 3.000 video presi da YouTube di quasi 1.600 individui con una lunghezza media di circa 181 fotogrammi. In definitiva, l'obiettivo è creare un algoritmo in grado di creare etichette che identifichino la persona presente nel video. I dati insieme alle informazioni sugli errori nonché le modalità di descrizione sono tutti consultabili direttamente sul sito.
284. Repository del set di dati KEEL
Il repository di set di dati KEEL contiene il set di dati del software open source basato su Java progettato per assistere in vari tipi di rilevamento dei dati della conoscenza. KEEL, noto semplicemente come Knowledge Extraction basato sull'apprendimento evolutivo, può essere addestrato per imparare come aggiungere valori mancanti, modelli ibridi e metodi statistici per valutare gli esperimenti tra una serie di altri compiti. I download dei set di dati e un elenco completo degli algoritmi presenti in KEEL possono essere scaricati direttamente dal sito.
285. Club di prestito
La pretesa di fama del Lending Club è il suo status di prestatore peer-to-peer che consente ai mutuatari di ricevere prestiti anche quando non hanno necessariamente il punteggio di credito per prendere in prestito dai finanziatori tradizionali. Oltre agli aspetti innovativi del funzionamento del sito, fornisce anche statistiche che includono punti salienti della piattaforma, informazioni sui prestiti rifiutati, numeri sulle prestazioni degli investitori e persino un dizionario di dati che contiene dati storici. Questi numeri generalmente iniziano dal 2007 e possono essere scaricati in CSV.
Il Museo di Storia Naturale è considerato da molti uno dei musei più riconoscibili al mondo, ma la digitalizzazione e la possibilità di esaminarne il catalogo attraverso il portale open data probabilmente sarebbero una novità per molti. Con 91 set di dati che includono collezioni di microfossili e fossili, nonché record di lotti indice tra altri materiali, i dati sono aperti al pubblico e possono essere scaricati gratuitamente in più formati.
287. I vocabolari Getty
Questo sito è perfetto per giornalisti ed editori che desiderano rimanere entro determinate linee guida di stile quando descrivono e classificano determinate opere d'arte, nomi di artisti, architettura, materiali e nomi geografici. Questo sito collega gli utenti direttamente ai database di vocaboli controllati che ricercatori e catalogatori devono conoscere per soddisfare gli standard internazionali. Almeno qui, non c'è niente di meglio dei vocabolari Getty. I set di dati possono essere esplorati tramite testo o SPARQL e possono essere scaricati tramite il sito.
288. Corpus CLiPS Stylometry Investigation (CSI).
Il CLiPS Stylometry Investigation Corpus probabilmente non è ciò a cui la maggior parte delle persone pensa quando sente le parole CSI, ma il corpus CSI è comunque un set di dati composto da recensioni e saggi degli studenti. Oltre al testo stesso, il sito rileva la presenza di metadati e informazioni incorporati nel documento per avere molteplici usi. Offerto e distribuito sotto la licenza Creative Commons, tutto ciò che il corpus chiede in cambio dell'utilizzo del set di dati è un'attribuzione.
Universal Dependencies v2 si riferisce alla seconda versione aggiornata del progetto Universal Dependencies, uno sforzo per sviluppare un'annotazione treebank che possa essere utilizzata in modo coerente con diversi linguaggi. Nella versione aggiornata i ricercatori troveranno dozzine di banche degli alberi UD per diverse lingue tra cui afrikaans, greco antico, giapponese, olandese, finlandese e cinese oltre all'inglese. La versione più recente di Universal Dependencies può essere trovata e scaricata nella parte inferiore di questa pagina Web.
290. Tubo flessibile
Webhose è una fonte di prim'ordine di set di dati prelevati direttamente dai repository del sito e aperti al pubblico. I ricercatori possono ordinare gli articoli di notizie per lingua; arabo, francese e olandese sono solo alcune delle lingue con numeri di articoli superiori a 100.000. Inoltre, gli articoli di notizie in inglese sono ulteriormente suddivisi in categorie come intrattenimento e sport da abbinare alle recensioni e ai post sui forum. Gli editori e i ricercatori digitali possono trarre vantaggio dall’esplorazione di questi set di dati.
291. Dati Wiki
Wikidata è una fonte sottovalutata di contenuti e idee sia per editori che per ricercatori. Secondo questa pagina, esistono diversi modi per accedere al materiale nei dump dei dati, sebbene l'uso di JSON sia quello maggiormente consigliato dal sito. Disponibili e totalmente gratuiti sia per uso non commerciale che commerciale, tutti i dati disponibili qui sono accessibili e scaricabili gratuitamente sotto la licenza Creative Commons.
292. Collegamenti Wiki
Situato comodamente nel quadro di Google Code, Wiki Links è un progetto open source che cerca di fornire alle persone l'accesso a quel particolare set di dati unico. Su questa pagina web i ricercatori possono scaricare i testi README, i file di dati e la licenza Creative Commons. Gli editori o gli individui generalmente orientati alla tecnologia hanno molto da aspettarsi quando esaminano questo enorme set di dati. Basta navigare nel sito, fare clic e iniziare a scaricare i file.
293. Wordnet
WordNet è un lessico inglese composto dai componenti della lingua, avverbi, sostantivi, aggettivi e verbi classificati in gruppi distinti che vengono poi utilizzati per esprimere idee particolari. Il risultato finale è uno strumento utile che classifica le parole in base a come vengono utilizzate e al loro significato piuttosto che a come suonano quando vengono pronunciate. Si segnalano le applicazioni di WordNet nella programmazione linguistica insieme alle numerose pubblicazioni e statistiche disponibili sul sito.
294. Atlante del cervello di Allen
L'Allen Brain Atlas, creato dall'Allen Institute for Brain Science Resources, è uno strumento per studiare e imparare di più sul cervello umano e su come risponde quando il corpo umano è sano e quando è malato. Utilizzando l'atlante i ricercatori possono conoscere il cervello umano e il suo sviluppo, nonché il glioblastoma e gli effetti del cancro sul cervello. I giornalisti che trattano questi argomenti possono visitare questo sito per set di dati e informazioni.
295. NITR
Il NITRC, o Neuroimaging Informatics Tools and Resources Clearinghouse, è il luogo in cui giornalisti ed editori possono rivolgersi per il neuroimaging. Messo insieme e promosso come iniziativa per la condivisione dei dati di neuroimaging, questo sito ospita dati provenienti da diversi progetti come il progetto 1000 Connectome, la Addiction Connectome Preprocessed Initiative, nonché rispettivamente i progetti INDI-Prospective e Retrospective. Gli individui sono liberi di scaricare i dati attraverso il sito web. Le neuroimmagini scattate in varie fasi non sono mai state così accessibili.
Il progetto Human Connectome Project Young Adult è la continuazione dello sforzo in corso per creare una mappa accurata del connettoma umano come sarebbe visto nella maggior parte degli adulti normali. Attraverso due fasi, 1200 adulti sani sono stati scansionati attraverso una combinazione di tecniche di fMRI a riposo e imaging di diffusione. Giornalisti ed editori in cerca di informazioni sul cervello non troveranno un altro sito con più dati sul connettoma umano nei giovani adulti sani.
297. Archivio dati NIMH
Il NIMH Data Archive, o NDA in breve, non è tanto una fonte di dati indipendente quanto una piattaforma per la distribuzione e l'archiviazione dei dati. Su questo sito Web sono presenti dati raccolti nel corso di numerosi articoli e progetti di ricerca, nonché la fornitura di metodi e strumenti che consentono una migliore analisi e collaborazione. I riepiloghi dei dati sono disponibili gratuitamente e i fornitori di contenuti che riportano le ultime novità scientifiche possono utilizzare queste informazioni per dare notizie.
298. Neurodati
NeuroData si dedica a condurre ricerche sulla relazione unica tra mente e cervello. Grazie all'impegno del sito nei confronti della scienza aperta e della ricerca riproducibile, i fornitori di contenuti hanno accesso a una pubblicazione e a diversi set di dati a cui è possibile accedere seguendo i collegamenti sulla pagina web. Di particolare interesse per coloro che desiderano vedere i dati di persona è la disponibilità di codice gratuito e strumenti di analisi che rendono l'esplorazione del lavoro di NeuroData ancora più semplice.
299. Neuroelettro
Il Progetto NeuroElectro è progettato con l'intento di raccogliere le varie caratteristiche elettrofisiologiche associate a diversi tipi di neuroni e aggregarle in un unico database. Questo progetto cerca di studiare la relazione tra i neuroni nel tentativo di studiare le differenze tra i vari tipi di neuroni. Il sito si collega ad articoli ed elenca i tipi di neuroni e le proprietà elettrofisiologiche scoperte finora. I fornitori di contenuti possono fare affidamento su questo sito come fonte di dati sulle relazioni neurone.
300. Serie ad accesso aperto di studi sull'imaging
La serie di studi di imaging ad accesso aperto, conosciuta da molti anche come OASIS, è un progetto progettato con l'obiettivo di rendere i set di dati delle risonanze magnetiche cerebrali accessibili alla comunità scientifica in generale. Giornalisti e ricercatori possono accedere a pubblicazioni che mettono a confronto i dati MRI tra adulti, nonché a una scheda informativa completa dal documento completo di OASIS che confronta e confronta i risultati di oltre 400 soggetti. Le informazioni e gli strumenti possono essere scaricati dal sito in diversi formati.
301. OpenfMRI
Per i giornalisti che desiderano accedere ai set di dati MRI senza i problemi associati ad altri siti, l'attenzione di OpenfMRI.org nel rendere i set di dati MRI accessibili al pubblico è uno sviluppo positivo. Proveniente direttamente dai ricercatori stessi, questo sito ospita una varietà di set di dati come il set di dati di apprendimento della classificazione, il compito di giochi d'azzardo misti e il compito di assunzione di rischi analogo al palloncino. La varietà e la quantità di dati consente ai ricercatori di trovare nuove strade di indagine attraverso questo sito.
302. Studyforrest
Prendendo in prestito il suo nome dal famoso film Forrest Gump, studyforrest cerca di capire di cosa è capace il cervello quando deve funzionare a un livello superiore mentre si confronta con una stimolazione naturale ma altrettanto complessa. Anche così, il sito riconosce che la quantità di dati fMRI raccolti da questi studi ha applicazioni più ampie di quanto sembrerebbe a prima vista. I fornitori di contenuti possono sfogliare le 19 pubblicazioni che hanno utilizzato di studyforrest e possono persino accedere direttamente ai dati.
303. Database aperto di cristallografia
Come ci si aspetterebbe naturalmente dal titolo, il Crystallography Open Database è una raccolta di 385.697 minerali e composti metallo-organici, strutture cristalline organiche e inorganiche con la notevole eccezione dei biopolimeri. I fornitori di contenuti che desiderano saperne di più sulle strutture cristalline possono effettuare ricerche in base alla formula strutturale o eseguire una query di ricerca corrispondente con l'opzione di navigazione. Ci sono anche software e dati su questo sito che rendono questo sito particolarmente prezioso nel campo della chimica.
304. Archivio dei pianeti extrasolari della NASA
Considerata da tempo una delle principali fonti di informazioni sullo spazio, la NASA continua la sua tradizione di risorsa inestimabile con il suo archivio di esopianeti. Questo sito ospita una serie di strumenti e software interattivi come il servizio Transiti ed Effemeridi, il Periodogramma, lo Strumento di tracciamento dei pianeti confermati e la possibilità di caricare interattivamente file e cercare tabelle. I fornitori di contenuti alla ricerca di approfondimenti unici possono utilizzare questi dati per farlo la prossima volta che gli esopianeti faranno una grande notizia.
305. Sondaggio digitale del cielo Sloan
Chiunque può creare mappe tridimensionali dell'Universo con l'aiuto dello Sloan Digital Sky Survey, o SDSS. Sia i giornalisti che i fornitori di contenuti possono accedere ad algoritmi, dati di immagini, set di dati, tutorial e ulteriore sviluppo di materiali visivi allo scopo di educare il pubblico sia formalmente che informalmente. Il sito discute inoltre esplicitamente di rendere i propri dati accessibili al pubblico tramite notizie e social media. Questo è uno strumento visivo inestimabile per i fornitori di contenuti.
306. StatSci.org
Statsci.org offre un elenco completo di risorse a cui il pubblico può accedere e utilizzare a seconda delle proprie esigenze particolari. Alcune informazioni includono il servizio di set di dati elettronici e casi di studio compilati dall'UCLA. Insieme ai set di dati grezzi, ci sono anche libri di testo collegati a questa pagina. Ciò include titoli come il Manuale di piccoli set di dati e casi di studio in biometria. I fornitori di contenuti in cerca di statistiche non possono sbagliare dando un'occhiata a questo.
307. ERIC
ERIC, noto anche come Istituto di Scienze dell'Educazione, è una risorsa che funge da motore di ricerca per chiunque cerchi informazioni nel campo dell'istruzione. La ricerca preliminare offre anche la possibilità di filtrare esclusivamente le informazioni sottoposte a peer review e i testi completi basati su ERIC. Alla luce della frequenza con cui i budget per l’istruzione e i metodi di insegnamento sembrano essere nelle notizie, questa è una fonte di dati che i giornalisti dovrebbero tenere a mente.
308.NTIS
Creato poco dopo la conclusione della seconda guerra mondiale, l'NTIS (National Technical Information Service) è stato formato con l'obiettivo di utilizzare i dati per aiutare le agenzie federali a prendere decisioni informate basate sui dati attraverso l'uso dei dati. Questa agenzia era originariamente l'archivio dei dati del governo americano nel campo della ricerca scientifica. Oggi il sito ospita milioni di pubblicazioni su una miriade di argomenti. Le sole informazioni storiche rendono questo sito meritevole come fonte di dati per giornalisti ed editori.
Il sito web dell'ODI (Open Data Institute) ospita il cosiddetto Open Data Certificate, uno strumento gratuito disponibile online sviluppato con il preciso scopo di esaminare criticamente e riconoscere la qualità dei dati aperti. Dal punto di vista di un editore o di un giornalista, il sito ospita anche numerosi set di dati su argomenti che vanno da elenchi di sovvenzioni ad avvisi di allergie insieme a elenchi che possono essere scaricati in formato CSV.
310. Archivio GitHub
GitHub è facilmente uno dei repository e degli archivi di dati più popolari e conosciuti su Internet grazie alla sua facilità di collaborazione, capacità di archivio e accessibilità per quanto riguarda la codifica. Che si tratti di tentativi di creare bot in grado di eseguire determinati compiti o di sviluppare applicazioni, GitHub è un sito in cui editori di contenuti e giornalisti possono facilmente imbattersi in prodotti potenzialmente degni di nota. È possibile accedere all'archivio seguendo le istruzioni del tutorial per JSON o Big Query.
311. Modelli sociologici
SocioPatterns è un progetto incentrato sulla ricerca di modelli nell'attività umana e nelle dinamiche sociali attraverso i dati. Come previsto da un obiettivo così ampio, le informazioni del sito sono state utilizzate in pubblicazioni che affrontano una vasta gamma di argomenti, dalla diffusione delle malattie a casi di studio sulle differenze tra le personalità online e offline degli individui. I set di dati sono disponibili per la visualizzazione, così come gli articoli pubblicati contenenti informazioni che gli editori probabilmente troveranno rilevanti prima o poi.
312. Mappa indipendente
Indie Map è il risultato dell'acquisizione di informazioni da oltre 2.000 dei siti più frequentati di IndieWeb e dell'inserimento dei dati in forme visive interattive come un'API Social Graph, un set di dati con funzionalità di query SQL e le informazioni grezze che sono state sottoposte a scansione su un totale di 5.7 milioni di pagine web. Gli editori digitali interessati al software open source e a ciò che questi dati potrebbero dire su queste comunità online possono accedere alle informazioni direttamente dal sito web.
Simon Fraser continua a rafforzare il suo status di università rispettabile con la disponibilità del suo set di dati riguardante "Statistiche e social network dei video di YouTube". Prendendo informazioni da un crawler che utilizzava l'API di YouTube per trovare video, i file contengono dati su milioni di video e set di dati di informazioni sugli utenti. Il sito specifica che i download dei dataset sono solo per scopi accademici, ma attraverso il sito potrebbe essere possibile trovare fonti e riferimenti giornalistici su questo progetto.
314. ACLED
ACLED, o Armed Conflict Location and Event Data Project, offre dati pubblici riguardanti la protesta e la violenza politica nei paesi in via di sviluppo. Le informazioni fornite qui includono numeri sulle vittime, informazioni sulle date e sui luoghi della violenza o della protesta, nomi dei gruppi interessati e dati sulle rivolte e sugli scontri violenti che si sono verificati. ACLED fornisce l'accesso a report, pubblicazioni e immagini regolari, nonché ai dati disponibili per il download sul sito.
315. Istituto canadese di informazione legale
Il Canadian Legal Information Institute, o CanLII come viene chiamato nel linguaggio comune, è un sito che fornisce libero accesso alle statue e ai loro regolamenti, alla giurisprudenza dei tribunali di varie giurisdizioni tra cui la Corte Suprema del Canada, le corti provinciali e d'appello e la Queen's Bench, insieme alle sentenze di vari tribunali amministrativi e organi istituiti per legge. Con 301 database di giurisprudenza e oltre 140.000 decisioni giudiziarie disponibili per la visualizzazione, i giornalisti e gli editori digitali che si occupano di argomenti legali trarrebbero vantaggio dall'aggiunta di questo sito ai segnalibri.
316. Centro per la pace sistemica
Il Centro per la Pace Sistemica, o CSP, è un'organizzazione che si è dedicata all'analisi dei sistemi globali allo scopo di affrontare il problema della violenza politica. Su questo sito, i giornalisti che stanno facendo ricerche in quest'area avranno accesso ad analisi sui conflitti in Africa, sulle tendenze dei conflitti a livello globale, tra gli altri, insieme a riassunti delle tre principali pubblicazioni dell'organizzazione come Terza Guerra Mondiale e Global Report e Virtual di CSP. Biblioteca.
317. Correlati del Progetto Guerra
L'obiettivo del progetto Correlates of War, o COW, è quello di aiutare nella raccolta e distribuzione di dati quantitativi come nell'area delle relazioni internazionali. Mantenendo il suo impegno nell'applicare i principi scientifici ai dati sulle relazioni internazionali, COW rende i suoi set di dati liberamente accessibili al pubblico. Questi database contengono numeri su informazioni che giornalisti e ricercatori possono utilizzare, come conflitti militarizzati tra stati, membri del sistema statale, capacità materiali nazionali e alleanze formali.
L'European Social Survey, o ESS, è un sondaggio condotto in tutta Europa con l'obiettivo di misurare i vari modelli di comportamento, atteggiamenti e credenze di diverse popolazioni in varie nazioni. Poiché i giornalisti sono spesso interessati a conoscere l'opinione del pubblico, la serie ESS Topline, che copre argomenti che vanno dal benessere personale e sociale degli europei, all'atteggiamento nei confronti del welfare e persino alla presenza dell'ageism nel Regno Unito, può rafforzare una storia in modo più ampio. modi di uno.
319. Fondo per la Pace
Il Fondo per la Pace è un'organizzazione che si concentra sulla prevenzione dei conflitti e sulla sicurezza attraverso lo sviluppo di strumenti che possono essere utilizzati per mitigare i conflitti. Nel corso della sua carriera, il FFP ha lavorato in collaborazione con giornalisti, ONG, organizzazioni locali e le loro controparti internazionali, nonché con i governi. Sia che cerchino tendenze, analisi comparative e dati globali, giornalisti ed editori possono trovare i materiali che desiderano attraverso lo strumento di esplorazione dei dati integrato nel browser del sito.
320. L'indagine sociale generale
Il lavoro del General Social Survey (GSS) si concentra sulla raccolta di informazioni su vari aspetti della moderna società americana come mezzo per tenersi al passo con le tendenze e i modelli attitudinali e comportamentali della popolazione. Con questa pratica di tracciamento delle tendenze che risale al 1972, i soli dati storici sono una miniera d’oro per i giornalisti che vogliono esplorare le tendenze. Utilizzando GSS Data Explorer, ricercatori e giornalisti sono in grado di scaricare, esaminare e persino valutare i dati.
321. Gesis
GESIS è un istituto tedesco per le infrastrutture dedicato alle scienze sociali. Offre diverse scienze sociali, insieme a lavori di ricerca e servizi che vanno dalla metodologia di indagine all'informatica applicata, raccolta dati, pianificazione degli studi e analisi dei dati, per citare alcune delle attività svolte da GESIS. I giornalisti interessati ad argomenti come l'approccio metodologico GESIS, l'utilizzo di immigrati sovraqualificati e altro ancora possono trovare molte informazioni nella sezione pubblicazioni.
Da argomenti come l'aborto all'educazione sessuale, la religione è così pervasiva che anche in paesi largamente laici la posizione di una persona su argomenti sociali difficili può essere influenzata dal credo religioso. In Global Religious Futures, il Pew Research Center esamina le tendenze negli atteggiamenti e nelle credenze delle persone in relazione alle religioni globali. I giornalisti che desiderano esaminare dettagli come l’influenza dell’evangelicalismo in politica o l’atteggiamento nei confronti della lapidazione possono utilizzare Data Explorer per trovare risposte nei numeri.
323. Indice per la gestione del rischio
L'Indice per la gestione del rischio, noto anche come INFORM, è un luogo a cui ricercatori e giornalisti possono rivolgersi per valutazioni del rischio in situazioni in cui esiste il rischio di crisi o disastro umanitario. L’organizzazione offre collegamenti a dati su argomenti come i tassi di mortalità infantile, l’indice di disuguaglianza di genere e la frequenza della siccità, tra gli altri numeri. E' inoltre possibile visualizzare e scaricare i dati di INFORM o accedervi attraverso la mappa interattiva del sito.
324. INEDO
L'INED, o Istituto francese per gli studi demografici, è una delle fonti di dati e statistiche più prolifiche che un giornalista possa trovare su Internet. Con oltre 70 pubblicazioni ricercate e pubblicate ogni anno per seguire la popolazione mondiale in formato grafico, nonché statistiche che misurano domande come la differenza di fertilità tra i sessi insieme a notizie e metodi di risorse. I ricercatori alla ricerca di risultati accurati da una fonte attendibile li troveranno con l'INED.
325. Archivio delle reti internazionali
L'International Networks Archive di Princeton offre una combinazione unica di pubblicazioni, con ricerche come Human Development Report 1999 e Global Networks: A Journal of Transnational Affairs disponibili per la lettura su questo sito. Su questo sito i giornalisti potranno approfondire i dati storici pubblici completi e aggiornati dell'archivio. Gli argomenti trattati qui includono assistenza sanitaria, armi, libri, musica, migrazione, regioni, Internet, politica e trasporti sono solo un esempio dei materiali che i ricercatori possono esaminare qui.
326. Programma di indagine sociale internazionale
Fondato fin dall'inizio come mezzo di collaborazione tra persone di diverse nazioni, l'International Social Survey Program (ISSP) ha condotto ogni anno indagini su una varietà di argomenti importanti nel campo delle scienze sociali. Gli argomenti nel corso degli anni hanno incluso, tra le altre questioni, la disuguaglianza sociale, l'identità nazionale, la cittadinanza, i social network e l'orientamento al lavoro. I risultati dell'ISSP possono essere ricercati per anno o per argomento e possono essere scaricati di conseguenza sul sito web.
327. Associazioni di studi internazionali
Giornalisti o altri ricercatori che sono alla ricerca di discussioni informative e intellettuali su questioni relative a questioni transnazionali, internazionali e globali, l'International Studies Association (ISA) riunisce le competenze di ricercatori, accademici ed esperti politici tra altri nomi. L'Enciclopedia degli studi internazionali dell'ISA presenta saggi sottoposti a revisione paritaria ricchi di discussioni approfondite su argomenti riguardanti la ricerca in questo campo, nonché saggi che forniscono informazioni raccontate da una prospettiva più storica.
328. Dati transnazionali sul web
La pagina incredibilmente utile del professor James W. McGuire della Wesleyan's University, appropriatamente intitolata Cross-National Data on the Web, è una pagina di risorse piena di collegamenti a dati rilevanti sullo sviluppo economico e globale. Tra i set di dati che i giornalisti potranno scoprire qui, ci sono dati sulla pianificazione familiare, sui risultati scolastici, sulla sottoalimentazione, sull'acqua e sui servizi igienico-sanitari, sull'orientamento al libero mercato e informazioni specifiche sull'America Latina e sui Caraibi, solo per citarne alcuni dall'elenco. Le fonti dati elencate qui sono impeccabili.
329. Centro norvegese per i dati di ricerca
Il Centro norvegese per i dati di ricerca è un'istituzione che supporta e aiuta i ricercatori in diverse aree della ricerca empirica come la privacy, la raccolta e l'analisi dei dati, la valutazione della metodologia e l'etica nella ricerca. Qui, i ricercatori troveranno software e strumenti sviluppati e consigliati dal centro da abbinare a un'ampia raccolta di dati regionali, individuali e istituzionali a cui è possibile accedere gratuitamente. Anche i risultati del centro contenuti nel rapporto annuale sulla ricerca e sulla privacy sono sempre una lettura interessante.
330. IPUMS
IPUMS non è necessariamente una fonte di dati nel senso che la maggior parte delle persone si aspetterebbe sentendo il termine, ma è comunque una fonte utile per i giornalisti grazie al suo ruolo di aggregatore, archiviatore e organizzatore dei dati forniti da altre entità. Nel caso in questione, IPUMS USA funge da sorta di archivio di dati per i microdati del censimento statunitense, con dati che risalgono al 1790 e risalgono fino ai giorni nostri.
331. GUADAGNO ND
L’ND-GAIN Country Index, un’iniziativa organizzata dalla Global Adaptation Initiative dell’Università di Notre Dame, misura la resilienza di un paese ai cambiamenti climatici e ad altre forze della globalizzazione. Questo indice include punteggi di vulnerabilità in settori quali cibo, salute, infrastrutture ed ecosistemi, nonché punteggi di preparazione per un massimo di 500.000 punti dati. Queste informazioni contengono due decenni di dati dal 1995 al 2014 sotto forma di file CSV e sono disponibili per il download.
In questo sito, giornalisti ed editori possono accedere ai dati aperti riguardanti lo stato della polizia e della criminalità nel Regno Unito. I dati contengono statistiche utili sulle squadre di quartiere, sulle singole forze di polizia, sui numeri dei fermi e delle perquisizioni, nonché statistiche sulla criminalità e sui risultati. Utilizzando questo sito, i giornalisti possono effettuare confronti tra le forze di polizia e individuare le tendenze nella giustizia penale. Ottenere informazioni è semplice come scegliere l'intervallo di date, scegliere la forza di polizia e quindi attendere il fascicolo.
333. Pagina dei dati internazionali generali di Paul Hensel
La pagina generale dei dati internazionali di Paul Hensel è una serie di collegamenti raggruppati sotto le intestazioni Stati e sistema internazionale, Dati geografici internazionali, Capacità statali, Raccolte di dati sulle scienze sociali e Alleanze, trattati e organizzazioni. Ogni risorsa elencata in questa pagina web contiene dati allo stato dell'arte che daranno automaticamente credibilità al lavoro di un giornalista. Queste fonti possono includere qualsiasi cosa, dal software ai set di dati e agli archivi, ma ogni collegamento qui incluso è utile.
334. TRAC
Nel mondo post-11 settembre, il terrorismo e i suoi effetti devastanti sulle popolazioni locali hanno ricevuto molta attenzione da parte dei media. TRAC, su trackingterrorism.org, fornisce ai ricercatori analisi approfondite e informazioni riguardanti questi argomenti. Questo sito contiene informazioni su diverse migliaia di gruppi terroristici diversi. Il prezzo per utente singolo di 500 dollari può essere un po’ alto in anticipo, ma vale il prezzo pagato per coloro che scrivono sulla violenza e sulla guerra al terrorismo.
335. Dipartimento di giustizia penale del Texas
Interessato al funzionamento interno del sistema di giustizia penale del Texas? Sei curioso di scoprire chi è attualmente nel braccio della morte? Il Dipartimento di giustizia penale dello Stato del Texas dispone di numerose informazioni sulle ultime dichiarazioni dei prigionieri prima dell'esecuzione, statistiche sul braccio della morte per genere e razza, nonché ulteriori statistiche e schede informative sulle esecuzioni. Il Dipartimento di giustizia penale del Texas è la fonte più affidabile per i giornalisti.
336. Sistema integrato delle organizzazioni della società civile
Il Sistema integrato delle organizzazioni della società civile, o iCSO, è progettato per facilitare la comunicazione tra le organizzazioni della società civile e il Dipartimento degli affari economici e sociali. Oltre all'efficacia del solido quadro, la pagina web include set di dati e categorie per ulteriori informazioni. I dati possono essere ordinati per settore, tipo di organizzazione, regione coinvolta e status ECOSOC dell'organizzazione. Questa è una fonte di dati che i giornalisti possono sicuramente utilizzare per trovare fonti.
337. Università di tutto il mondo
Universities Worldwide è un database di università di tutto il mondo in cui è possibile effettuare ricerche per ulteriori informazioni. La ricerca può essere effettuata in base all'elenco mondiale o filtrata esclusivamente in base alle università degli Stati Uniti e gli utenti possono anche aggiungere i propri collegamenti nel processo. Gli editori di dati con un consistente contingente di studenti, o anche i giornalisti che desiderano verificare un fatto, possono tutti trarre vantaggio dalla possibilità di accedere a un database come questo su richiesta.
338. Programma sui dati sui conflitti di Uppsala
Questo è il sito web dell'Uppsala Conflect Data Program, uno dei più noti fornitori di informazioni sulla violenza organizzata. Nel corso degli ultimi 40 anni il programma si è affermato anche per il suo lavoro di raccolta dati sulla guerra civile. I giornalisti possono utilizzare questa fonte di dati per cercare informazioni su conflitti specifici e attori in tali conflitti e possono anche accedere a questi dati allo scopo di scaricarli.
339. Pop mondiale
Il progetto WorldPop, il risultato finale della fusione dei progetti AsiaPop, AfriPop e AmeriPop, è dedicato all'archiviazione di set di dati demografici spaziali che a loro volta trovano applicazioni come mezzo per fornire supporto agli sforzi di soccorso in caso di calamità. Gli editori di contenuti e i giornalisti coinvolti in cause di giustizia sociale o che sono altrimenti alla ricerca di opportunità efficaci per soccorrere in caso di catastrofe potrebbero essere interessati a questo progetto. I ricercatori possono scaricare i dati o rivedere i casi di studio online.
340. Progetto espresso
DraftExpress è forse più noto su Internet per le sue ricerche, i rapporti di scouting pre-draft, le finte scelte del draft e il suo meticoloso mantenimento delle altezze e delle misurazioni dei giocatori in linea con i suoi dati storici. I potenziali clienti menzionati in questo sito provengono dalla NCAA, dalle scuole superiori e persino dai campionati internazionali. I giornalisti sportivi o i fornitori di contenuti che intendono offrire commenti relativi al basket possono rivolgersi alle statistiche di DraftExpress mentre discutono dei giocatori e degli eventi mentre si verificano nello sport.
341. Betfair
Betfair è forse meglio conosciuto come il sito a cui rivolgersi per le scommesse sportive. Di interesse soprattutto per i fornitori di contenuti e gli editori digitali è la disponibilità di informazioni storiche dettagliate sui dati sui prezzi e sulla cronologia del sito. È possibile accedere e scaricare i dati con o senza il timestamp dettagliato, offrendo anche dati estesi sulle corse dei cavalli e sulle altre offerte di mercato del sito dall'anno giugno 2004 all'ottobre 2017.
342. CRICSHEET
Cricsheet offre un servizio simile a una serie di altri hub di dati sportivi, ma è un sito specializzato esclusivamente nella fornitura di dati sul cricket. Il sito offre statistiche e dati palla per palla di numerosi campionati tra cui la Premier League indiana, le nazionali di un giorno, nonché numeri per squadre maschili e femminili, per citare solo alcune delle categorie più grandi. Gli editori di contenuti alla ricerca di dati storici sul cricket possono scaricare i dati in formato CSV o XML.
343. Dati di serie temporali transnazionali
Con dati politici, economici, legislativi e sui conflitti interni che coprono oltre 200 anni di dati in oltre 200 nazioni in tutto il mondo, l'archivio dati di serie temporali transnazionali è uno dei set di dati più completi su Internet. I dati vengono archiviati, più comodamente, in un foglio di Google Drive che si apre automaticamente facendo clic sulla categoria del file. In cambio di una citazione, queste informazioni possono essere visualizzate in parte o per intero a seconda delle esigenze del ricercatore.
344. Ford GoBike
Ford GoBike è il nome del programma di bike sharing utilizzato nella Bay Area. Mentre molte persone utilizzano senza dubbio questo programma per mantenersi in forma ed evitare l’uso di combustibili fossili, il sistema di bike sharing ha tenuto traccia dei dati di viaggio. Naturalmente, queste informazioni non includono nulla che possa identificare i ciclisti, ma dettagli come il numero della bici, l'ora di inizio, l'ora di fine, il tipo di ciclista e le stazioni di arrivo e partenza sono inclusi nei dati. Vale la pena esplorarlo.
345. Traffico marittimo
Marine Traffic è una società che traccia e tiene traccia dei movimenti delle navi e dei viaggi oceanici utilizzando i big data. Il tipo di informazioni coperte dai servizi API AIS di Marine Traffic includeva navi, informazioni sui viaggi e dati sulle navi in questione come arrivi previsti, persino incidenti, foto, dettagli della nave e previsioni di viaggio. Tuttavia, su questo sito sono disponibili piani tariffari, quindi non è chiaro quante ricerche possano essere effettuate gratuitamente.
346. Bixi
I programmi di bike sharing Bixi sono forse alcuni dei programmi di bike sharing più conosciuti in alcune delle più grandi città del Nord America. È interessante notare che il marchio rilascia anche dati aperti che forniscono informazioni su cose come la cronologia dei viaggi e lo stato delle stazioni, nonché confronti che potrebbero essere effettuati tra membri e utenti occasionali. I giornalisti locali che stanno esaminando il modo in cui le persone utilizzano e inseriscono i programmi di bike sharing nelle loro vite hanno tutte le ragioni per immergersi in questi dati.
347. Banca dati sugli incidenti
Da Amelia Earhart al volo AirAsia 8501 dell'Indonesia, gli incidenti aerei e aerei sono un argomento che attira l'attenzione della gente. Il database degli incidenti archivia e memorizza i dati sugli incidenti aerei avvenuti tra gli anni 1920 e 2017. Gli incidenti conteggiati in questo database includevano incidenti con dirigibili civili e militari, incidenti che hanno comportato la morte di celebrità o personaggi famosi, incidenti di elicotteri con 10 o più morti , voli passeggeri di linea e non di linea che si sono conclusi con la morte.
348. Trasporti per Londra
Transport for London è l'ente governativo responsabile della supervisione dei trasporti pubblici nell'area della Grande Londra. Sul sito web sono disponibili mappe della metropolitana e dei treni insieme a una guida alla pianificazione del viaggio. Oltre a tutti questi servizi pratici, il sito ospita anche molti dati aperti tra cui ciclismo, qualità dell'aria, vasca e persino l'ostrica. Chiunque sia interessato a vedere come i residenti della Grande Londra utilizzano i trasporti pubblici può trarre vantaggio dall’accesso a questi dati.
349. CMAP
CMAP è responsabile della pianificazione e organizzazione regionale nelle contee di DuPage, Lake, McHenry, Kendall, Kane, Cook e Will nell'Illinois. Come si può vedere dal sito web, le responsabilità del CMAP si estendono alla gestione di questioni come lo sviluppo della comunità, le tasse e gli indicatori economici, e persino le strade e i trasporti pubblici. Questo è il motivo per cui i dati aperti riguardanti aree come gli indicatori regionali e i viaggi sono utili a un giornalista che cerca di comprendere il quadro generale del futuro della regione.
350. Quadro di analisi del trasporto
Realizzato grazie a una collaborazione tra il Bureau of Transportation Statistics e la Federal Highway Administration, il Freight Analysis Framework raccoglie dati che vengono poi utilizzati per valutare lo stato generale e le prestazioni del sistema merci. Questo software raccoglie informazioni su dettagli come il tipo di merce e il tonnellaggio rispetto alle stazioni di partenza e di arrivo e tali dati sono a loro volta resi disponibili al pubblico per accedervi e scaricarli in forma completa o riepilogativa.
351. Mozilla Scienza
Mozilla Science è un software collaborativo, open source e con pratiche aperte, concepito per agevolare lo sviluppo e la distribuzione di diverse fonti di dati e risultati della ricerca. A parte gli interessi di trasparenza, la decisione di aprire i programmi e di eseguire il crowdsourcing del processo di perfezionamento rende più semplice migliorare i programmi già esistenti. Con progetti disponibili in una varietà di campi tra cui le scienze della vita e la medicina, tra gli altri, ci sono soluzioni software che possono rappresentare progressi degni di nota nel campo.
352. Fantastici set di dati
L'attrazione quando si tratta di Cool Datasets è facilmente evidente dal nome del sito. In questa pagina, i set di dati rientrano in sei categorie generali: governo, intrattenimento, scienza, invii degli utenti, varie e apprendimento automatico. I giornalisti che desiderano esplorare i dati e cercare storie trarranno il massimo dal verificare ciò che questo sito Web ha da offrire. C'è un'opzione per esplorare i set di dati e, se possibile, anche per contribuire con i set di dati.
OpenDataMonitor è una piattaforma che prende set di dati pubblici e li presenta in un modo più intuitivo e facile da seguire per le persone. I ricercatori possono accedere alla piattaforma per vedere un riepilogo di ciò di cui sono capaci le risorse di dati aperti e saranno in grado di vedere i dati esistenti presentati loro in un modo visivamente più accattivante. Il sito spiega la sua metodologia e i suoi parametri di riferimento e gli editori non dovrebbero avere problemi a trovare dati che valga la pena pubblicare.
354. CrunchBase
CrunchBase è forse meglio conosciuto per la sua enfasi sulle statistiche e il suo impegno nel garantire ai suoi lettori l'accesso ai migliori dati disponibili. Persone orientate al business visitano questo sito ogni giorno per conoscere le ultime tendenze negli investimenti e nell'industria. Qui giornalisti ed editori troveranno notizie e nuove discussioni sulle ultime tendenze del business. Nel frattempo, come parte della sua opzione a pagamento, il sito ospita anche ampi set di dati che possono essere analizzati utilizzando gli strumenti software di Crunchbase.
355. Indice
Index è una piattaforma con una proposta di vendita unica perché ha qualcosa da offrire a tutti, tra startup, investitori, analisti e aziende. Il sito ospita inoltre informazioni su oltre 100.000 aziende del settore tecnologico e allo stesso tempo offre agli utenti la possibilità di ordinare, creare ed esportare fogli di calcolo. Editori e giornalisti che sfogliano i titoli dei giornali per scoprire potenziali angolazioni della storia possono anticipare le notizie economiche attraverso questo sito. L'indice può essere insolito, ma non c'è dubbio che sia una risorsa utile.
356. SEMRUSH
SEMrush è orgoglioso di essere uno degli strumenti di search intelligence più consolidati a disposizione degli esperti di marketing online. Tra l'accademia e i webinar, i ricercatori hanno tutte le opportunità di apprendere i fondamenti. Tuttavia, le sezioni blog e notizie contengono informazioni sufficienti affinché editori e giornalisti possano facilmente rimanere aggiornati su tutte le ultime novità in materia di pubblicità online e SEO. I servizi di SEMrush hanno un prezzo, ma forniscono molte informazioni di qualità gratuitamente.
357. Ahrefs
Ahrefs è forse meglio riassunto come una suite di strumenti di marketing potenzialmente utili a chiunque pubblichi contenuti online. Il sito offre una combinazione di servizi come ricerca di contenuti, monitoraggio web, ricerca di parole chiave e ricerca di backlink per aiutare gli utenti a decodificare il successo dei concorrenti. Probabilmente molto utile per gli editori online nel grande schema delle cose, il blog di Ahrefs da solo rappresenta un eccellente valore per coloro a cui piace che il proprio marketing venga fatto con un taglio basato sui dati.
358. Lista degli angeli
AngelList, con il suo nome scelto in modo intelligente, è fondamentalmente composto da due parti Craigslist e una parte LinkedIn con la sua enfasi nel riunire investitori, persone in cerca di lavoro e startup in un unico posto. Oltre a questo interessante concetto di sito, ci sono molte opportunità per i giornalisti intraprendenti di scoprire le startup più in voga e le ultime tendenze di investimento prima che diventino mainstream. Con la sua interfaccia semplice e il suo forte orientamento al business, questo sito è utile per i professionisti in più di un modo.
359. Acquisito
Praticamente in tutti i settori, un’acquisizione aziendale può cambiare un intero settore praticamente da un giorno all’altro. Acquired è un sito che si assume il compito di tenere informato il pubblico quando viene effettuata un'acquisizione nel settore tecnologico. Pieno di statistiche che possono essere visualizzate sul sito insieme alla possibilità di filtrare le ricerche, i giornalisti che scrivono di tecnologia trarranno il massimo dal rendere Acquired una parte regolare della loro navigazione web quotidiana.
360. Mattermark
Mattermark è un servizio a pagamento che semplifica la vita ai decisori aziendali producendo elenchi di clienti di qualità che tengono conto sia delle aziende che dei loro dipendenti chiave. Fornendo profili aziendali completi, flessibilità con la sua API e persino funzionalità di esportazione allo scopo di apportare aggiornamenti, Mattermark fa di tutto. Le aziende che desiderano indirizzare meglio la propria portata e allo stesso tempo monitorare i risultati delle loro campagne, trarranno molto vantaggio dall'iscrizione a questo.
361. Startup fintech
FintechStartupsCo funge da tipo di aggregatore che tiene traccia di quanto diverse aziende sono state in grado di raccogliere nelle loro IPO. Dotato di un design minimalista che alterna tra le schede "startup" e "notizie", questo è un modo semplice e veloce per i giornalisti di rimanere aggiornati sulle ultime notizie sulla raccolta fondi. Nel frattempo, anche gli editori alla ricerca di contenuti veloci e storie veloci trarranno vantaggio dal dare un'altra occhiata a ciò che questo sito ha da offrire.
362. Datafox
Nel caso in cui il nome non rivelasse tutto, DataFox è un'azienda che si impegna a fornire ai propri clienti aziendali le informazioni di cui hanno bisogno per massimizzare i propri CRM e in generale per prendere decisioni basate sui dati. Offrendo servizi che includono intelligence aziendale e per conferenze, API e segnali aziendali, questa azienda è effettivamente uno sportello unico per le aziende che stanno rinnovando le proprie vendite e il lavoro di sensibilizzazione. Anche gli editori digitali e i fornitori di contenuti potrebbero voler verificarlo.
363. Openinvio
OpenSpending è una piattaforma gratuita, accessibile praticamente ovunque nel mondo, che consente agli utenti di cercare ed esaminare dati finanziari di pubblico dominio. Per i membri della società non hacker, questo è un potente strumento di visualizzazione e analisi. I giornalisti, in particolare, possono utilizzare OpenSpending per trovare nuovi spunti interessanti e perseguire angoli di storia come suggerisce l'azienda direttamente sul suo sito. Come ulteriore vantaggio, i giornalisti sono tra le professioni specificatamente richieste sul forum.
364. API sportiva ESPN
Non contento di essere solo il canale sportivo più popolare via cavo, ESPN sta espandendo la sua influenza nella codifica e nelle API. Nel Centro per sviluppatori, il sito offre agli editori la possibilità di scegliere tra diverse API che includono note di ricerca, classifiche di potere, scelte di bozza, calendari e titoli. C'è anche un'API che carica profili, biografie e statistiche degli atleti in tutti i principali sport. I giornalisti che si apprestano a scrivere una storia con contenuti sportivi non possono che trarre vantaggio dalla navigazione tra questi.
365. Riferimento sportivo
Per gli amanti degli sport che fanno i conti con i numeri e che amano le statistiche avanzate e le risorse tutte in un unico posto, Sports Reference è uno dei migliori siti sul web. Con dati storici che includono statistiche di squadra e giocatori in attacco e difesa, i ricercatori sportivi possono ampliare o restringere quanto desiderano con questo sito. Inoltre, ci sono numeri praticamente per tutti i principali sport, dal basket al baseball, e dati separati anche per i diversi sport universitari.
366. Set di dati di milioni di brani
La "Million Songs Collection", dal nome appropriato, comprende ben 28 set di dati di metadati e informazioni sulle caratteristiche audio di esattamente un milione di brani. In gran parte frutto del lavoro di LabROSA della Columbia University insieme a Echo Nest, queste informazioni sono accessibili e ospitate sul sistema AWS di Amazon. Gli utenti possono eseguire ricerche di informazioni tramite Infochimps, rendendole ancora più accessibili ai giornalisti in cerca di curiosità oscure e agli editori di contenuti.