Det finnes mange forskjellige typer nettsteder som gir et vell av gratis, freemium og betalt data som kan hjelpe publikumsutviklere og journalister med deres rapportering og historiefortelling. Teamet hos State of Digital Publishing vil gjerne anerkjenne disse, som avledet fra manuelle søk og anerkjennelse fra vårt eksisterende publikum.
1. Kaggle
Kaggle er et nettsted som lar brukere oppdage maskinlæring mens de skriver og deler skybasert kode. Nettstedet er hovedsakelig avhengig av entusiasmen til det store fellesskapet, og er vert for datasettkonkurranser for pengepremier, og som et resultat har det enorme mengder data samlet inn. Enten du leter etter historiske data fra New York Stock Exchange, en oversikt over godteriproduksjonstrender i USA eller banebrytende kode, er denne siden stappfull av informasjon.
2. Wikipedia
Det er umulig å være lenge på Internett uten å komme inn i en Wikipedia-artikkel. Med artikler som spenner fra fullt hentede kilder og refererer til historiske biografier til tidslinjer for nær og fjern fremtid, er det trygt å si at Wikipedia har sementert sin status som et gratis nettbasert leksikon. Mellom oppføringen som fungerer som den generelle oversikten over emnet og de mange bøkene og nettreferansene nettstedet gir, er Wikipedia en forfatters beste venn på mange måter.
3. Vanlig kryp
Som det kan antas ut fra navnet på nettstedet, søker Common Crawl eller "gjennomsøker" nettet etter data som det deretter lagrer og bygger i et åpent depot som brukere har tilgang til. For to eksempler på hva som er mulig med dette nettstedet, gir virtuelle patentmarkører og omfattende lister over nettsteder som tilbyr RSS-feeder et lite utvalg av hvor kraftig denne applikasjonen er. Hvis det er data- eller nettstedsammenligninger du ønsker å gjøre, er dette et tilgjengelig verktøy for å lage original informasjon.
4. EDRM
EDRM, forkortelse for Electronic Discovery Reference Model, er et nettsted for juridiske fagfolk som er dedikert til å realisere potensialet til e-discovery og reglene og forventningene rundt hvordan informasjon styres. I tillegg jobber EDRM-medlemmer sammen for å utvikle samarbeidsstandarder, programvare og pedagogiske verktøy som er designet for å fremme fellesskapets mål. For å skaffe informasjon om hvordan teknologi kan og har endret de prosessuelle og administrative aspektene ved juridisk praksis, er dette nettstedet du ønsker å besøke.
5. Mahout
Mahout fokuserer på et stykke programvare med samme navn som prøver å finne ut logistikken ved å bygge et miljø som er i stand til å lage høyytende maskinlæringsapplikasjoner som kan skaleres og lages raskt. For forskere som ønsker å kompilere og manipulere sine egne datasett eller prøve seg på maskinlæringsapplikasjoner, er denne programvaren spesielt nyttig. Dette nettstedet vil ha enkeltpersoner godt på vei til å bli ferdige med denne programvaren.
Lemur-prosjektet er en database som fokuserer på å støtte forskning på å hente informasjon og håndtere menneskelige språkteknologier. Med nettsider som teller omtrent 1 milliard og 10 språk samlet inn fra januar 2009 til februar 2009, gjør den store mengden materiale som finnes og støtte det til en utmerket ressurs for forskere. Mellom alt dette og den ekstra støtten som finnes på nettstedet, vil alle som har interesse for teknologi og menneskelige språk ha mye å jobbe med på denne siden.
Project Gutenberg er en katalog som inneholder offentlige romaner, artikler og andre verk. Nettstedets 54 000+ e-boksamling spenner fra kjente materialer som Shakespeare, Mark Twain og Jane Austen til mindre kjente verk av mer obskure navn som Henri Bergson og Samuel Butler. Enten du griper en klassisk roman for å være belest eller forsker på hvordan mennesker opplevde livet på 1800-tallet, er Project Gutenberg en utmerket ressurs.
8. Datasett for millioner sanger
Dette er et nettsted som inneholder et fullstendig datasett som inneholder lydfunksjonene og metadataene til omtrent 1 million populære sanger. I tillegg til det primære million-sangdatasettet, er det også en rekke datasett som fellesskapet har bidratt med i relaterte kategorier som blant annet coverlåter, sjangeretiketter og tekster. Musikkhistorikere, hobbyister eller forskere som ønsker denne informasjonen, vil kunne sortere dataene relativt enkelt. Dette kan meget vel være det mest omfattende datasettet om dette emnet på hele Internett.
9. Amazon
Alle kjenner Amazon som en digital forhandler, men visste du at Amazon også er vert for gratis offentlige datasett som er åpne for alle uten å måtte lagre eller laste ned noe på sine egne enheter? Med data som spenner fra vær, rommiljø og meteorologisk informasjon til bilder fokusert på å utvikle algoritmer som hjelper datasyn, er det ingen mangel på alternativer for de som ønsker en mer praktisk måte å analysere enorme mengder data på.
For å fremme mer åpenhet, få flere innbyggere til å engasjere seg og oppmuntre til dialog, tilbyr Canadas regjering omfattende data som en del av sitt Open Government-initiativ. På dette nettstedet kan du finne datasett om myndighetsrelaterte spørsmål som kapasitetsnivåene til hjemløse krisesentre i Canada, samt regionale tall på deltakelsesnivåene til engelsktalende og frankofoner i offentlig sektor. Med tilgang til datasett av denne typen, er det ikke nødvendig å være avhengig av andres statistikk for å finne informasjon.
11. Datakataloger
Data Catalogs, nå Data Portals, tilbyr brukere et praktisk nettsted for å bla gjennom åpne dataportaler fra hele verden. Siden portalene blir vurdert og kuratert av ulike nivåer av myndigheter, en rekke frivillige organisasjoner og til og med Verdensbanken, er dataene som er tilgjengelige for analyse ekstremt høy kvalitet. Brukere har muligheten til å bla gjennom eller bidra med dataportaler. Fra et forskningssynspunkt gjør mangfoldet av emner og informasjon dette nettstedet til et spesielt praktisk sted å begynne et søk etter informasjon.
Data.gov.uk er et nettsted som lar enkeltpersoner finne og få tilgang til data som ulike offentlige organer, offentlige avdelinger, lokale myndigheter og offentlige etater publiserer. Her kan forskere finne informasjon om det økonomiske klimaet for små bedrifter, handel, import, industri og eksport eller til og med forske på betalinger over £25 000 utført av offentlige avdelinger. Siden nettstedet eksplisitt sier at dataene kan brukes til forskning, kan informasjonen som dekkes her til og med generere flere ideer etter hvert som forskere går gjennom den.
Dette nettstedet er der den amerikanske regjeringen gir åpne data som publikum kan få tilgang til i form av datasett. På toppen av rådataene tilbyr siden også en rekke verktøy som kan brukes til å lage datavisualiseringer samt bygge applikasjoner for nett og mobil. Gjør ingen feil. Dataene er enorme med informasjon som spenner fra kredittkortklager til føderale studielånsprogramdata i over 197 000 datasett. Dette nettstedet tilbyr mange muligheter for innovasjon og omfattende analyser.
14. DataSF
DataSF tilbyr hundrevis av datasett i forhold til både byen og fylket San Francisco. Interessert i å se hva lokale og regionale lobbyister har presset på for? Trenger du statistikk om kriminalitet? Bla gjennom Vis-fanen for å se hva folk har oppnådd med dataene, eller bruk skjemaet for å gi et bidrag. Laget med åpne data og tilbyr et akademi, en blogg og en rekke andre verktøy, er dette nettstedet i stor grad drevet av samarbeid og fellesskap. Dette gjør det til en ressurs for forskeren.
15. DataFerrett
DataFerrett er forskjellig fra mange nettsteder ved at det ikke er et depot eller katalog så mye som et verktøy som lar brukere tilpasse data fra lokale, statlige og føderale kilder gjennom dataanalyse og utvinning. Dette verktøyet lar brukere lage tilpassede og omfattende regneark og deretter gjøre den samme informasjonen om til et kart eller en graf uten å måtte laste ned eller aktivere annen programvare. Det har aldri vært enklere å organisere massive datainndata og gjøre dem om til noe som er lett å lese.
16. Inforum
Gjennom University of Maryland gjør Inforum amerikanske økonomiske data tilgjengelig for allmennheten. Mange amerikanske offentlige etater har bidratt til dette nettstedet til det punktet hvor nettstedet nå har tusenvis av "økonomiske tidsserier", som det kaller dem, og disse inneholder tall om industriproduksjon, prisindekser, arbeidsstatistikk og forretningsindikatorer. Dataene er fritt tilgjengelige og kan nås med enten en personlig bærbar PC eller stasjonær. Forskere som ønsker å se godt på de rå, økonomiske dataene har en ressurs i Inforum.
17. Europeana
Ifølge nettstedets egne tall utgjør Europeanas samlinger totalt over 50 millioner poster. Ved å bruke de kurerte datasettene her, kan forskere finne informasjonen de leter etter på kortere tid. Datasettene her inkluderer kategorier som 3D-modeller, italienske kart fra første verdenskrig, og til og med en samling av over 20 000 historiske bilder fra blant annet litauiske museer. For enten generelle historiske søk eller som et utgangspunkt for å gå gjennom Europeanas enorme poster, er dette en utmerket ressurs å ha.
På toppen av sin non-stop dekning av siste nyheter og hendelser, har The Guardian også en hel seksjon viet til datablader. Stykkene her spenner fra alvorlige temaer som effektiviteten av boligpolitikk mot hjemløshet til litt mer lettbente temaer som hvilke land som har flest nobelprisvinnere. Journalister og forskere har ingen mangel på informasjon å bruke i sine egne prosjekter fra denne siden. Ved hjelp av et raskt søk er det mulig å finne data om omtrent alt.
Gene Expression Omnibus er vert av National Center for Biotechnology Information, og er et nettsted som inneholder "offentlige funksjonelle genomikkdata" som er i samsvar med MIAME-standarder (Minimum Information About a Microarray Experiment). Nettstedet godtar også data som er arrayet eller sekvensert samtidig som det gir de nødvendige verktøyene for å finne og laste ned informasjonen. De som er interessert i å studere genomer eller skaffe seg informasjon om emnet vil ha alle dataene de trenger her og litt til.
University of Chicagos Center for Spatial Data Science (CSDS) har lenge vært anerkjent for sine bidrag til innovasjon og fremgang innen samfunnsvitenskap, og utforsker den neste grensen med sitt inntog i romlig analyse og teknologi. Arbeidet til CSDS har applikasjoner innen praktisk talt alle felt som må kjempe med plass når det gjelder å nærme seg problemene. Følgelig har felt som miljøøkonomi, folkehelse og kriminologi alle dratt nytte av disse applikasjonene. Dedikasjonen til CSDS til åpen kildekode-programvare og distribusjon av informasjonen gjør dataene enda mer tilgjengelige.
21. Konect
Gjennom bruk av data samlet inn av University of Koblenz-Landaus Institute of Web Science and Technologies, tilbyr KONECT (Koblenz Network Collection) forskning utført innen nettverksvitenskap og relaterte emner. Prosjektet bruker en serie av sine egne programvarenettverksanalyseverktøy for å knuse tall og produsere tegnede plott og algoritmer. KONECT vert deretter resultatene av analysearbeidet direkte på nettstedet. Med over 200 datasett å velge mellom, er dette en ressurs som er verdt å utforske.
22. MIdata
MIdata er et nettsted som fungerer som et depot for data som skal brukes av maskinlæringsdata. Disse datasettene kan variere fra en samling av menneskelige ansiktsuttrykk til mer vitenskapelige emner som å forutsi hvordan molekyler vil binde seg. Med oppføringer delt inn i kategorier som tilbyr tilgang til rådata, veiledninger i material- og metodeseksjonen, samt læringsoppgaver og utfordringer, lar dette nettstedet forskerne analysere gjennom depotet for datasett som er av interesse.
23. NASDAQ
NASDAQ er en verdenskjent børs som lenge har vært en utmerket ressurs for journalister og forskere på jakt etter data fra finans- og næringslivet. Her finner du informasjon om børsnoteringer, historiske prisdata og de siste finansnyhetene som gjør dette nettstedet til en online destinasjon for finansiell data. NASDAQ Composite tilbyr også betalte dataalternativer for de som ønsker å gjøre en dypere analyse. Dette er en meget respektert og veletablert ressurs.
24. NASA
Fra månelandingen har alle hørt om dette myndighetsorganet og dets angrep ut i verdensrommet. Av interesse for journalister er imidlertid hvordan NASA også er en verdifull kildedata gjennom sitt Space Science Data Coordinated Archive. Her kan forskere finne romvitenskapelige misjonsdata i kategorier som blant annet astrofysikk, bilderessurser og heliofysikk. I tillegg er det også en rekke hvitebøker tilgjengelig på nettstedet for de nye dataene som sendes inn.
Socrata er et nettsted som tar myndighetenes data som er tilgjengelig og setter dem inn i et format som gjør det enklere for folk å analysere, klikke seg gjennom og finne informasjonen de leter etter. Designet spesifikt med behovene til ikke-tekniske individer som offentlige politiske vansker, forskere, gründere og bekymrede borgere i tankene, bruker Socrata skyen til å kompilere data fra en rekke kilder. For journalister som prøver å forstå effektiviteten til ulike retningslinjer, er dette en nyttig plattform.
26. Quandl
Quandle er et nettsted som tilbyr primært økonomiske og finansielle data formatert med behovene til investeringseksperter i tankene. Basert på over 500 informasjonskilder fra troverdige organisasjoner som CLS Group, FN, sentralbanker og Zacks blant andre for å samle dataene sine, er denne datakilden perfekt for forskere og journalister som ønsker å få det store bildet på et øyeblikk. Takket være nettstedets Excel-tillegg har det aldri vært enklere for brukere å få direkte tilgang til dataene.
27. Carnegie Mellon University
Carnegie Mellon University har et velfortjent rykte som en utmerket akademisk institusjon. Det mange ikke vet er at Carnegie Mellons StatLab er en nyttig ressurs for journalister på jakt etter data. Dette datasettarkivet inkluderer data om problemer som MLB-lønningene til nordamerikanske spillere i 1986, samt data som er designet for bruk for å evaluere nøyaktigheten til statistikkprogramvare. I bytte mot anerkjennelse er disse datasettene tilgjengelige for offentlig bruk.
28. UCI
UC Irvine Machine Learning Repository, referert til som UCI, er et nettsted som lagrer massevis av interessante data som journalister kan bruke. Hjemme til 394 datasett når dette skrives, har nettstedet den ekstra fordelen av å ha et grensesnitt som er enkelt å søke. Noen av de mer populære datasettene inkluderer blant annet informasjon om "menneskelig aktivitetsgjenkjenning ved bruk av smarttelefoner", vin og bankmarkedsføring. I bytte for å bruke alle disse dataene, ber nettstedet bare om en sitering.
29. UCR
Hvis du er en journalist som ser på utviklingen av maskinlæring, vil UCR Time Series Classification/Clustering-siden sørge for utmerket lesing. Nettstedet gir et nyttig orienteringsdokument som vil gi deg all bakgrunnsinformasjonen du trenger å vite. Sammen med en oversikt over hva informasjonen inneholder, tilbyr siden også muligheten til å laste ned dataene direkte. Bare husk å bruke sitasjonsformatet nettstedet ber om hvis du bruker disse datasettene.
30. US Census
Trenger du statistikk over befolkningsformuen? Vil du vite den nøyaktige kjønnsfordelingen for et bestemt felt? Den amerikanske folketellingen er et nettsted som har alle disse dataene og mer tilgjengelig for offentlig visning. Sorter data etter år eller region, og du vil raskt kunne finne statistikken som folk flest ikke engang visste ble tatt med i den amerikanske folketellingen slik de var. Disse tallene var tilgjengelige i Excel og Microsoft Word som alternativer som gjør dataene enda mer tilgjengelige for journalister.
31. Wolfram Alpha
Wolfram Alpha er faktisk en beregningsmotor som lar brukere legge inn dataene de vil vite og motta en beregning. Motoren gjør blant annet statistiske data og analyser, kjemi, datoer og klokkeslett, og til og med ord og lingvistikk. For brukere som prøver å avdekke nye måter å håndtere data på, er dette spesielt nyttig på grunn av hvordan det bare kan spytte ut nye beregninger ved å trykke på en knapp. Særlig journalister kan tjene mye på å bruke dette som en tilleggsressurs.
32. Yelp
Det viser seg at Yelp er mer enn bare restauranter og brukeranmeldelser av bedrifter. Denne brukerdrevne vurderingssiden har også et datasett som gir forskere tilgang til anmeldelser, brukerdata og virksomheter for "personlige, pedagogiske og akademiske formål". Ut fra selskapets telling er det 4,7 millioner anmeldelser og 156 000 virksomheter i 12 storbyområder inkludert i datasettet. Med disse tallene kan materialene og trendene forskere potensielt kan oppdage i disse dataene være en hyggelig overraskelse.
33. Dataverden
Vil du ha en liste over fjernede Facebook-sider? Hvordan høres det ut å kunne sortere amerikanske økonomiske data etter fylke? Data World er et nettsted som lar folk dele, være vert for, samarbeide og holde styr på data. Nettstedet inneholder til og med en seksjon for journalister som skisserer årsakene til at Data World er nyttig for medlemmer av profesjonen, samtidig som det peker på hosting-mulighetene til en strømlinjeformet FOIA-prediktor, samt sider designet for å hjelpe med organisering. Alt i alt er dette en solid blanding av data og data-hosting.
World Factbook, som drives og drives av CIA, gir deg informasjon om samfunnsstrukturer, historie, militære og økonomiske situasjoner for 267 land sammen med kart, flagg og et sett med tidssoner som følger materialene på verdenskartet. Siden tilbyr en grundig og dyptgående titt på emnet på en måte som går utover det grunnleggende. Kort fortalt er dette en datakilde som bør være i enhver journalists arsenal.
35. HealthData.gov
Administrert av US Department of Health & Human Services, HealthData.gov tilbyr publikum tilgang til "helsedata med høy verdi" i håp om å fange oppmerksomheten til gründere, beslutningstakere og forskere. I det minste innen produkt- og tjenesteutvikling har folk vært i stand til å undersøke disse dataene og få resultater. Journalister som ønsker å være i forkant av helsedata eller som undersøker en uttalelse som en helsepersonell har lagt ut, kan bruke denne siden til å finne svar.
36. UNICEF
Dette er et nettsted som gir umiddelbar troverdighet til journalister som bruker informasjonen den tilbyr. Statistikken som UNICEF dekker inkluderer de som er relatert til helsespørsmål og menneskerettigheter som utdanning, mødrehelse, barnefattigdom, vann og sanitærforhold og funksjonshemming blant mange andre kategorier av statistikk som føres. Det er nyttig for forskere fordi det er oppdatert og støttet av en av de mest kjente organisasjonene på planeten. Journalister kan ikke gå galt med å sitere denne datakilden.
Verdens helseorganisasjon er en internasjonal organisasjon som samler helsestatistikk og informasjon over hele verden. Bortsett fra informasjonen som kan finnes direkte på hjemmesiden, tilbyr nettstedet også data gjennom Global Health Observatory. Disse dataene inkluderer informasjon om trinnene landene tar mot universell helsehjelp, helseforskning og utvikling blant andre kategorier. Journalister vil finne mye informasjon om utbrudd, helsenødsituasjoner og helsedekning fra et internasjonalt perspektiv her.
Med tilgjengeligheten av Googles offentlige data kan journalister tydeligvis stole på Google på mer enn én måte. Søkemotoren juggernaut har offentlige data tilgjengelig og der ute for å analysere med over 100 offentlige datasett til navnet sitt. Dataemne spenner fra det ekstremt alvorlige med World Development Indicators og Human Development Indicators hele veien til det interessante med data om de farligste veiene i Europa. Alt en forsker trenger å gjøre er å kjøre et søk og se hva Google Public Data har.
39. Gap Minder
Gap Minder tilbyr data om en rekke lokale og nasjonale indikatorer sammen med lenker og informasjon om alle dataleverandørene. Ved å bruke dette nettstedet kan forskere se informasjon som hvor gamle kvinner er når de gifter seg for første gang, statistikk over alkoholforbruk og dødsårsaker hos barn. For journalister som skriver med et internasjonalt tilsnitt eller som driver med sammenlignende data, er dette en utmerket ressurs. Dette er uansett en nyttig datakilde.
40. Google Trender
Google Trends er et verktøy som gir forskere innsikt i hva folk ser etter akkurat nå på dette øyeblikket. Forskere kan sammenligne dataene med trendene som har skjedd tidligere og kan også bruke verktøyet til å gjøre estimater i forkant av for eksempel høytiden, for å se hva som vil skje for søk i fremtiden. Google-trender tilbyr grafer, hete emner og mange muligheter til å avdekke nyhetene før de offisielt er nyheter.
41. Google Finance
Google Finance tilbyr en rask og enkel mulighet til å gjøre et mer dyptgående søk på et selskap som investorer har flust om. Enkle måter å filtrere tekniske indikatorer på og gjennomgå de siste nyhetene om selskapet i ett enkelt, greit vindu som lar deg sortere informasjon enda mer. I tillegg er det gratis. For journalister som ønsker å undersøke økonomien til et handlet selskap, tilbyr Google Finance et intuitivt grensesnitt for å få tilgang til denne informasjonen. Dessverre har Google nylig avviklet noen av kjernefunksjonene som finansportefølje. Her er noen alternativer til Google Finance .
42. DBpedia
Alle som noen gang har ønsket seg en enklere måte å kjøre Wikipedia-søk på, har grunn til å være begeistret for DBpedia. Drevet av fellesskapets engasjement, søker dette nettstedet å gjøre det mulig å kjøre mer sofistikerte søk mot Wikipedia-innhold. Med den engelske versjonen med 4,58 millioner oppføringer med klassifiseringer og tilhørende kategorier, er nettstedet godt i gang med å tilby omfattende dekning basert på informasjonen i Wikipedia. Journalister kan ikke gå galt med denne datakilden.
43. Pew Research
For mange er Pew Research i det øvre sjiktet når det gjelder undersøkelser, rapporter og forskningsdata. Nettstedet dekker emner som spenner fra politiske meninger til sosiale trender og utviklinger i ulike arbeidsplassbransjer. Pew Research har også en søkefunksjon som gjør det enklere enn noen gang å få tilgang til informasjon. Journalister som vil ha oppdatert statistikk og funn som kommer fra en kilde som er pålitelig og anerkjent, kan ikke gå galt med å henvende seg til Pew Research.
44. Bredt institutt
For journalister som ønsker å finne ut siste nytt i forhold til kreft, kan Broad Institute sine datasett være det perfekte stedet å finne informasjonen. Dette inkluderer også informasjon om tilleggsfag som bioinformatikk og beregningsbiologi samt hjernekreft og oppdagelse av molekylært mønster. Kort sagt, dette nettstedet gir journalister et ben opp når det gjelder å finne dybdedata om kreft for å lage historier ut av dataene fra Broad Institute.
45. UNdata
UNdata tilbyr informasjon om forskjellige land rundt om i verden. Dette inkluderer data som tekniske indikatorer, sosiale indikatorer og økonomiske indikatorer for hvert land som er involvert. For journalister som jobber med historier om menneskelig interesse eller historier som kan ha nytte av å bli underbygget av litt ekstra statistikk og data, er UNdata det ideelle valget. Nøyaktigheten til dataene samt FNs omdømme gjør dette til en datakilde som journalister kan stole på mens de forsker.
46. Google Scholar
Tenk om det i stedet for å bla gjennom nettsteder var mulig å trekke opp et søk som ikke hadde annet enn fagfellevurderte artikler og akademisk materiale. Google Scholar gjør det mulig for folk å finne tidsskriftartikler, hvitebøker og publikasjoner av verdens ledende forskere. Som vanligvis er tilfellet for dette selskapet, er Google Scholar så intuitivt som det blir, og brukeren må bare skrive inn et nøkkelord for å få ballen til å rulle. Det har aldri vært så enkelt å søke etter akademiske artikler.
47. Reddit
Oftest kjent som "forsiden av Internett", er Reddit en av de mest populære nettstedene på Internett. I tillegg til å være en nøyaktig måler på hva som skjer på nettet, har nettstedet også en subreddit, eller et underforum, som også er viet til datasett. Brukere kan be om datasett, legge ut ressurser og ha diskusjoner om arbeid med data gjennom formater som JSON. Forskere tjener mye på å lese denne datakilden.
48. Datamarked
Qlik DataMarket gjør det mulig for deg å samle inn og håndtere data fra eksterne kilder. Denne plattformen lar brukere låne på tvers av flere datasett med muligheten til å kryssreferanser mot dataene de allerede har for å avgrense følelsen av større kontekst. Enda bedre, selv om dette er en betalt plattform avhengig av emnet, er det et gratis alternativ med Qlik Datamarket også. Journalister som utforsker dataene kan gjøre det til sitt hjerte.
49. Hubspot
Hubspot har alltid vært en tankeleder innen hvem som er hvem innen markedsføring for bedrifter. Fra et ståsted for å gjøre research, er dette et nettsted som vil fortelle forskerne alt om hva som skjer i bransjen, så vel som hva folk i markedsføringsindustrien snakker om akkurat nå i sanntid. Journalister kan bruke denne siden for å lære mer om trendene. På det notatet er Hubspot en stor ressurs for forskere.
50. Bureau of Justice Statistics
Kanskje ikke overraskende holder Bureau of Justice massevis av statistikk. På Spesialenhetens nettsted kan du finne tall om arrestasjoner, innsattes dødsfall, henrettelse med dødsstraff, politistatistikk og folketellinger av fengslene. Det strafferettslige systemet er et gjenstand for konstant fascinasjon for både offentligheten og menneskene som er involvert i det. Det er det som gjør Bureau of Justices statistikk enda mer nyttig for journalister som forsker på strafferettssystemet.
51. Uniform kriminalitetsrapport
Uniform Crime Report er en samling av statistikk om eiendomskriminalitet og voldelig kriminalitet som er samlet inn av FBI. Mens rettshåndhevelsesbyråer fra hele USA har rapportert disse dataene siden 1930, har funnene blitt publisert tilbake til 1958 og kan søke i . Journalister som ønsker å utforske kriminalitetsdataene har muligheten til å få tilgang til og bruke UCR-dataverktøyet for å utforske informasjonen som er tilgjengelig på dette nettstedet.
52. Uniform kriminalitetsrapportering
Uniform Crime Reporting er resultatet av et program som ble utviklet av International Association of Chiefs of Police i 1929. Tallene FBI har samlet inn her publiseres fire ganger i året. I tillegg til informasjonen som tilbys av UCR-programmet, inkluderer nettstedet også rapporter om hatkriminalitetsstatistikk, lovhåndhevelsesoffiserer drept og overfalt (LEOKA), samt resultatene og tallene levert av National Incident-Based Reporting System.
53. NACJD
NACJD, eller National Archive of Criminal Justice Data, er et nettsted som henter informasjon fra datasett som Uniform Crime Reports (UCR) og National Crime Victimization Survey (NCVS) og deretter lagrer og distribuerer statistikken. Dataene er designet for å bli kurert, lagret og vedlikeholdt for ultimat tilgjengelighet, og kommer i flere former, inkludert eksperimentelle, kvalitative og longitudinelle. Til syvende og sist gir dette journalister og andre forskere en annen måte å visualisere og få tilgang til strafferettsstatistikk.
54. Første databank
First Databank er et nettsted som omhandler narkotikadata. Nettstedet søker å fremme mer effektiv og mer datadrevet beslutningstaking innen legemiddelområdet. Dette gjør at leger og klinikere kan begynne å tenke på farmasøytiske legemidler på en annen måte gjennom bruk av First Databanks innovative bruk av teknologi. Fra et profesjonelt synspunkt er dette nettstedet spesielt nyttig på grunn av hvordan dataene kan hjelpe team med å tilpasse seg etter hvert som ny informasjon kommer. Dette er i det minste en nyttig ressurs for journalister som skriver i det farmasøytiske området.
55. FDA
FDA, kjent som Food and Drug Administration, er byrået som er ansvarlig for å beskytte folkehelsen gjennom tilsyn og godkjenning av legemidler, matprodukter, kosttilskudd, vaksiner og kosmetikk blant andre forbrukerprodukter. Som en ressurs har FDA datasett tilgjengelig for publikum å lese, samtidig som de gir tekniske data for folk som er komfortable med å jobbe med regneark og analysere informasjonen som kommer fra datasettene. Dette er definitivt en nyttig ressurs for journalister.
56. Drugbase
Noen gang lurt på nøyaktig hvor mye landet betaler i kjølvannet av en narkotikaepidemi? Går det rykter om at folk bruker narkotika annerledes enn før? Drugbase tilbyr en database som er stappfull av statistikk om trender og bruk av narkotika i USA. Det er infografikk så vel som publikasjoner om emner som komorbiditet av avhengighet og psykiske lidelser eller fakta om dopet (ikke fylle) kjøring. Dette er en ressurs som gir nok informasjon til å oppdage trender og foreta sammenligninger med tidligere data.
57. UNODC
UNODC, eller FNs kontor for narkotika og kriminalitet, har et nettsted viet til å fremme målet om å hjelpe medlemslandene med å ta i bruk sterkere standarder for forskning, datainnsamling og rettsmedisin. På dette nettstedet kan forskere finne en rekke statistikker og publikasjoner som dekker emner som datainnsamling, trendanalyse og forskningsprogrammer der det er mulig. En ressurs som er full av informasjon om en rekke rettsmedisinske emner samt vitenskapen om emnet.
Drug War Facts er et nettsted som tilbyr omfattende diskusjoner om krigen mot narkotika så vel som konsekvensene av politikken. Dette inkluderer statistikk og tall på detaljer som sammenligninger mellom kostnadene ved behandling i motsetning til kostnadene ved å stole på rettshåndhevelse, på tall på anslag for narkotikakontrollutgifter, og en mengde informasjon om omtrent alle emner relatert til krigen mot narkotika. For mange mennesker er dette det mest omfattende nettstedet på nettet med hensyn til krigen mot narkotika.
59. Nasjonalt senter for utdanningsstatistikk
Nasjonalt senter for utdanningsstatistikk, ofte referert til som NCES for korte, er stedet å gå for all utdanningsrelatert statistikk. Dette nettstedet har statistikk over tilstanden til studentutlån, anslag på utdanningstrender, sammen med datasett og sammenligningsverktøy som kan brukes til å gjøre mer dyptgående analyser. Journalister kan bruke denne ressursen til å avdekke trender, bekrefte offentlige uttalelser, gjennomgå National Center for Education Statistics sine publikasjoner og finne nye historier i dataene.
60. Verdensbanken
Verdensbanken er vert for en rekke statistikker og data utarbeidet av Development Data Group i finanssektoren så vel som makroøkonomi. Det er mulig å sortere gjennom data ved å bruke hashtags. Brukere kan velge mellom en rekke indikatorer og gjøre et valg etter land for å vurdere de ulike målene for utviklingsfremgang. Som sådan er dette en ressurs som alle som ser på medlemslandenes finansielle og/eller økonomiske tilstand kan dra nytte av å ha tilgang til.
61. Bureau of Labor Statistics
Bureau of Labor Statistics er en journalists kilde for tall og statistikk når de relaterer seg til gjeldende arbeidsforhold, hva som skjer på arbeidsmarkedet, samt hvordan prisene endres og påvirker den amerikanske økonomien. Med byråets statistiske arbeid som dateres tilbake til 1884, er det ingen mangel på økonomiske data der for forskere å lese. Nettstedet lagrer informasjonen i et brukervennlig grensesnitt og oppdaterer kontinuerlig dataene som er tilgjengelige for søk. Dette er en datakilde som er verdt å utforske.
62. Tallene
Blockbuster-utgivelser får mye oppmerksomhet i media, men det er vanskelig å si hvor godt et selskap faktisk har klart seg uten tall. Skriv inn "The Numbers". Denne nettsiden tilbyr forskning og data for film- og underholdningsindustrien. Forskere kan utforske inntektsestimater, forventninger til kommende utgivelser og andre investeringsdata via OpusDatas SQL-baserte søkemotorkapasitet. The Numbers er det første stedet eller forskere som besøker for pålitelig statistikk om filmer og filmer. Det er det som gjør det til en utmerket ressurs.
63. Film for alltid
Film Forever er et nettsted som forskere kan besøke for markedsintelligens og data for filmindustrien i Storbritannia. Her kan brukere finne ukentlige billettkontornummer for de 15 beste britiske utgivelsene, publikumsundersøkelser, rapporter, casestudier og organisasjonens flaggskip Statistical Yearbook. I tillegg har siden også en kalender som holder seerne orientert om når neste statistikk vil bli sluppet. Film Forevers nisje gjør den til en spesielt verdig datakilde.
64. IFPI
IFPI er et nettsted som er stolt av å ha fingeren på pulsen til den verdensomspennende plateindustrien. Brukere vil finne publiserte rapporter fulle av innsikt i innspilt musikk, nasjonale og globale salgsdata, samt rapporter om forretningssiden av musikkbransjen som viser hvordan selskapene investerer i musikk. Disse rapportene lar brukerne se hva som skjer. Denne siden vil holde forskere oppdatert på hva som skjer i musikkbransjen i sanntid.
65. Statista
Statista er en søkemotor som Google, bare i stedet for nettsider returnerer nettstedet data og statistikk. Med et enkelt trykk på en knapp kan brukere få umiddelbar tilgang til over én million statistikker og fakta. Brukere vil finne infografikk, statistikk om Kina, næringsmiddelindustrien, forbrukermarkeder, og mot en avgift er dokumenter og bransjerapporter også tilgjengelige for visning. Enten du leter etter informasjon om økonomi, sosiale medier eller Big Mac, er dette stedet å gjøre det.
66. EPA
EPA, som er forkortelse for United States Environmental Protection Agency, er det offentlige byrået som er ansvarlig for å beskytte mennesker og miljø ved å håndheve lovene som er satt opp og vedtatt gjennom Kongressen. På EPAs nettside kan brukere se gjennom en rekke datasett om emner som spenner fra landbruk til emner så smale som årlige utgivelser om giftige kjemikalier og avfallshåndteringsmetoder. Dette nettstedet er et utmerket valg for journalister som ønsker tilgang til rå miljødata.
67. Sentre for sykdomskontroll og forebygging
Denne nettsiden for Centers for Disease Control and Prevention fakturerer seg selv som en "one-stop shop for miljømessige folkehelsedata". På dette nettstedet vil forskere finne referanser og lister til datasystemer som mottar nasjonale midler mens de sporer og lagrer informasjon som er relatert til bekymringer for miljømessig folkehelse. Med fokus på programmer som opererer på nasjonalt nivå og tilgjengelighet gjennom direkte nedlastingsmuligheter, er dette en ressurs man kan stole på for den nyeste og mest nøyaktige informasjonen på nettet.
68. Nasjonale sentre for miljøhelse
Etablert etter sammenslåingen av tre tidligere uavhengige byråer, er National Centers for Environmental Health stedet å gå for høykvalitetsinformasjon om miljøet. Tilbyr omfattende data som spenner fra havdata til isregistreringer fra millioner av år siden, hvis problemet involverer miljøet, er sjansen stor for at dette nettstedet vil ha informasjon om det. Byråets forpliktelse til nøyaktighet og fortreffelighet i forvaltningen av et av de største arkivene i sitt slag gjør det også til et av få nettsteder på nettet som besitter, oppdaterer og vedlikeholder denne typen data.
National Oceanic and Atmospheric Administrations National Weather Service vil fortelle forskerne alt de trenger å vite om været. Denne siden tilbyr datasøk som inkluderer informasjon om kategorier som advarsler og prognoser, klima, geografiske prognoser og mer. I tillegg kommer dette med et intuitivt kart som er lett å følge med faner som kan klikkes på for ulike resultater. Enten du gjennomgår hva som skjedde lokalt eller finner prognosen for en by i en annen delstat, vil dette nettstedet avdekke informasjon raskt.
70. Wunderground
Wunderground er en ressurs som er dedikert til å sørge for at informasjon om været er tilgjengelig for alle rundt om i verden, med oppmerksomhet også til områder som ikke får mye dekning. Wunderground sier eksplisitt at de har tatt skritt for å sikre at brukeropplevelsen er utmerket på flere digitale plattformer. Dette betyr at siden er tilgjengelig via mobil så vel som via PC, noe som gjør den til en ideell ressurs for journalister som er på farten.
71. Værbase
Weatherbase gir informasjon om nåværende forhold, gjennomsnitt, klimainformasjon og reiseforhold for over 40 000 byer rundt om i verden ved hjelp av en enkel søkelinje. Bruk ledsagersiden siden lenker til for å finne ytterligere reiseinformasjon i forhold til valutaomregnere, koordinater og fylkesinformasjon blant annet morsomme fakta. Weatherbase kan også brukes til å finne steder å feriere utelukkende på grunnlag av hvordan været vil være. Lykke til med letingen!
72. Energiatlas
Publisert under International Energy Agency, Energy Atlas presenterer forskere muligheten til å se verden gjennom energistatistikk. Opprinnelig designet for å være en komplementær datakilde fra den opprinnelige oppstartsdatoen, kan nettstedet skryte av en animert Sankey flow energibalanse samt flere databaser som passer til publikasjonene som kan leses på Det internasjonale energibyråets statistikkside. Forskere vil finne både dette nettstedet og dets følgenettsteder ekstremt nyttige mens de undersøker hvordan land og byer bruker energi.
73. Bureau for økonomisk analyse
Bureau of Economic Analysis, eller BEA for kort, publiserer et bredt spekter av nyttig informasjon som lar forskere holde fingrene på pulsen til landets økonomi. På dette nettstedet er det tall på amerikanske økonomiske kontoer som inkluderer tall på forbruksutgifter, BNP og anleggsmidler blant andre nyttige data. Forskere kan søke etter region eller bransje så vel som etter nivå med internasjonale, nasjonale og regionale søkealternativer. Prøv den interaktive datasiden for å finne ut mer om byrået.
74. National Bureau of Economic Research
Nettstedet til National Bureau of Economic Research, eller NBER, er en datakilde som nærmer seg økonomi fra et analytisk ståsted. Den er vert for data om et bredt spekter av økonomiske emner med slike oppføringer som Index of African Governance, den offisielle forretningssyklusen, eksperimentelle sammenfallsindekser, ledende og resesjonsindekser og makrohistoriedatabasen. NBER har offisielle datasett publisert og kompilert under eget navn samt indekser kompilert av andre utgivere.
75. US Securities and Exchange Commission
United States Securities and Exchange Commission er et byrå som fungerer som en slags vakthund for å fremme åpenhet, rettferdighet og effektivitet i markedene. Interessant nok har nettstedet et regnskapsdatasett fra januar 2009 til oktober 2017 med oppdateringer hvert kvartal. Forskere kan stole på dette nettstedet for å holde seg oppdatert på de siste nyhetene når det gjelder registreringer og informasjonen den kan fortelle deg om selskaper og tilstanden til deres økonomi.
76. IMF
Det internasjonale pengefondet, også kjent som IMF, er en veletablert organisasjon i internasjonal økonomisk og finansiell sektor. På nettstedet kan forskere finne en rekke data om disse emnene. Brukere kan søke i datasett etter indikator og land og bla gjennom diagrammene og kartene mens de forsker. Populære datasett inkluderer handelsretning, primærvarepriser, finansiell soliditetsindikatorer, undersøkelser og internasjonal finansstatistikk blant annet verdifull informasjon.
77. Atlas – Harvard
Opprinnelig unnfanget av Harvard, er Atlas et nettbasert verktøy som lar folk visualisere og samhandle med et selskaps handelssituasjon. Atlas vil da ta informasjonen og foreslå ulike produkter som landet potensielt kan produsere for å forbedre økonomien. Dette er et verktøy som brukes av beslutningstakere, forretningsfolk, investorer og engasjerte medlemmer av offentligheten som ønsker å få en bedre forståelse av det økonomiske klimaet i et gitt land. Spørsmål om handel og nasjonale økonomier har aldri vært mer tilgjengelige.
Doing Business er et resultat av et forsøk på å foreta objektive evalueringer av forretningsregelverket. Nettstedet undersøker nesten 200 økonomier og mange byer, og måler detaljer som økonomiske indikatorer, samt rangerer hvor enkelt det er å gjøre forretninger. Dette nettstedet lar brukere undersøke effektene av ulike typer forretningsreguleringer mellom land og vertsrapporter samt omfattende kvalitative data. I tillegg gjør siden det også mulig å gjøre sammenligninger over tid.
79. Comtrade
Opprinnelig et prosjekt fra Storbritannias Department for Business, Energy, and Industrial Strategy i forbindelse med Department for International Trade, er Comtrade en utmerket ressurs. Ved å låne data fra FNs Comtrade Data, gir nettstedet brukere et interaktivt diagram som kan brukes til å søke, sammenligne og analysere de nøyaktige tallene for handel og varer mellom land. Bare velg rapporteringslandet, velg et partnerland og gjør valg så mye som mulig.
Global Financial Data er en kilde som ikke bare samler standard finansielle data, den tar finansiell informasjon fra 1200-tallet til nå. Denne informasjonen er hentet fra en rekke kilder, inkludert bøker, arkivert materiale, akademiske tidsskrifter og nyhetstidsskrifter. I tillegg har nettstedet datasett som bruker den statistiske metoden for kjedekobling. Sluttresultatet, fra brukerens perspektiv, er en ressurs som er som ingen andre på Internett i kraft av sine eksklusive data.
Visualisering av økonomi er mindre en ressurs i begrepets forstand for dataoppdagelse, og er mer en tjeneste som fokuserer på å designe informasjonsgrafikk og interaktive dashbord. I tillegg gjør Visualizing Economics også analyser og design med det uttrykkelige formålet å gjøre økonomiske data lettere å forstå. Gjennom dette nettstedet har journalister en legitim mulighet til å jobbe med en profesjonell som har mange års erfaring med å oversette økonomiske data til noe mer tilgjengelig for allmennheten.
EU Open Data Portal er et prosjekt som ble opprettet i etterkant av en beslutning fattet av EU-kommisjonen. På dette nettstedet tilbyr EU-institusjoner data for offentlig visning og bruk uten opphavsrettsbegrensninger og tilgjengelig uten kostnad. Datasett inkluderer CORDIS-referansedata, åpenhetsregisteret og til og med en fullstendig liste over personene, enhetene og gruppene EU har utstedt økonomiske sanksjoner mot. I tillegg er dataene tilgjengelige i en rekke digitale formater.
83. Åpne datanettverk
Open Data Network er et nettsted som lar brukere slå opp data etter region og by. Med en tydelig og intuitiv hjemmeside på nettstedet, har forskere muligheten til å søke etter datakategori, by og til og med prøvespørsmål. På hver side, etter å ha gått gjennom enten datakategoriene eller eksempelspørsmålene, er det praktiske lenker til enda flere datasett også. Organiseringen av data alene gjør Open Data Network til et nettsted som er vel verdt å utforske.
84. Landmatrise
Landmatrix er et nettsted som tilbyr en online database for landavtaler med den hensikt å fremme mer åpenhet om oppkjøp. I hovedsak kan dette verktøyet brukes til å visualisere og gi mening om de ulike landavtalene. Dataene forbedres, endres og justeres for å forbedre nøyaktigheten til informasjonen som gjøres tilgjengelig. Til dags dato har Landmatrix informasjon om over 1000 avtaler. Det er en kilde verdt å utforske for forskere.
FNs utviklingsprogram er vert for mange nyttige data om menneskelig utvikling rundt om i verden som publikum kan utforske. Med datoer som vanligvis strekker seg fra 1990 til 2015 i mange av disse datasettene, inkluderer indeksene fullstendige tabeller som trender i menneskelig utviklingsindeks, kjønnsulikhetsindeksen og livsløpskjønnsgapet. Forskere kan søke i dataene direkte gjennom søkefeltet og også gå etter land hvis intensjonen er å gå gjennom diagrammet.
86. OCED
OECD, kjent som Organisasjonen for økonomisk samarbeid og utvikling, har et nettsted som fokuserer på å hjelpe regjeringer i anti-fattigdomsinitiativer og velstand gjennom økonomisk stabilitet og vekst. På denne siden vil forskere finne fagfellevurdert materiale, publikasjoner, samt standarder og argumenter for å sette standarder. OECD er også vert for en faktabok som gir et solid økonomisk referanseverktøy for en rekke undersøkelser og spådommer om økonomiske utsikter som finnes på sidene.
87. US Department of Health & Human Services
US Department of Health & Human Services driver et nettsted som gir informasjon om presidentens råd for trening, sport og ernæring. Med fakta og data utarbeidet med bistand fra flere eksperter innen relaterte felt som kokker og idrettsutøvere. I tillegg har siden også en rekke statistikker. Forskere kan finne fakta om den fysiske aktiviteten til barn, de muskelstyrkende vanene til voksne, samt informasjon om slankevanene til publikum, så vel som fedme blant en rekke andre fakta og statistikker.
88. Partnere i informasjonstilgang for folkehelsearbeidsstyrken
Partners in Information Access for the Public Health Workforce er et prosjekt som ble til som et resultat av folkehelseorganisasjoner, amerikanske offentlige etater og biblioteker som spesialiserer seg på helsevitenskap. Emnesider på dette nettstedet inkluderer emner som tilskudd og finansiering, helsefremmende og helseopplæring, og litteratur og retningslinjer. Gjennom delen for folkehelseemner er det også data om emner som bioterrorisme, folkehelsegenomikk og tannhelse for å nevne noen emner.
I de siste tre tiårene har United Health Foundation gitt informasjon om helserangeringer for bruk som et middel til å måle folkehelsen. Nettstedet er vert for en rekke rapporter og publikasjoner som inkluderer rapporter om helsen til de som har tjent, seniorrapporter, kvinner og barns helse, årlige rapporter og til og med orienteringer om viktige emner for feltet. Bruk det interaktive kartet til å utforske etter region og lære mer informasjon. Det er også en søkelinje for videre navigering hvis forskere ser etter noe mer spesifikt.
90. Medicare
I USA er Medicare det primære middelet som mange er avhengige av for helseforsikring og tilgang til medisinsk behandling. Sammen med tjenestene det tilbyr i sanntid, tilbyr Medicare også data om standarder og kvalitet på behandling på tvers av fasiliteter og sykehus via sammenligningsdiagrammet og regelen. Det er det offisielle datasettet som brukes av Hospital Compare-nettstedet, og det er fullt av data som kan lastes ned til Excel for ytterligere enkel tilgang.
91. Overvåking, epidemiologi og sluttresultater (SEER)
Overvåking, epidemiologi og sluttresultater, også kjent som SEER, har et nettsted som er spesielt nyttig som en kilde til informasjon om statistikk om kreft. Den er vert for statistiske sammendrag som tillater forskning på tallene assosiert med kreft som kan sorteres etter kreftstedet, etnisitet, rase, alder, kjønn og til og med etter datatype. Nettstedet er også vert for publisering, datasett og programvare som kan brukes av forskere for enda dypere analyser.
Amnesty International er en organisasjon som lenge har vært en talsmann for menneskerettigheter og rettferdighet over hele verden. Det er også tilfeldigvis vert for mye data om statusen til menneskerettigheter rundt om i verden, samt informasjon om spesifikke grusomheter og forbrytelser mot menneskeheten på forskjellige punkter som en del av årsrapporten. Forskere kan bruke informasjonen til å sammenligne ulike år og se hvordan ulike land har utviklet seg eller gått tilbake på menneskerettighetsområdet.
93. Dataanalysegruppe for menneskerettigheter
Siden unnfangelsen for 25 år siden har Human Rights Data Analysis Group brukt vitenskapelige prinsipper på menneskerettighetsbrudd i forskjellige land rundt om i verden. Nettstedet er vert for publikasjoner som har blitt publisert i anerkjente medier som Washington Post og formelle publikasjoner gjennom Macmillan-utgivere sortert etter år. Sammen med organiserte publikasjoner som går tilbake i tid, var det også prosjekter som fant sted over hele verden. For et mer teknisk blikk på menneskerettighetsbrudd er dette et flott søk.
94. Internasjonale relasjoner og menneskerettighetsdata
Dette nettstedet er vert for databaser satt sammen av en rekke anerkjente organisasjoner, universiteter og til og med offentlige etater. Eksempler på disse vil være Manifesto Project, Minorities (at Risk) Project, Comparative Welfare States District, og Armed Conflict Database. Det er noen prosjekter som Polity IV-prosjektet som går tilbake til 1800-tallet. I mellomtiden måler prosjekter som Stockholm International Peace Research Institute (SIPRI) våpenoverføringer, internasjonale militærutgifter og sikkerhetstrender. Den beste måten å sette pris på dataene på er å gå til nettstedet og utforske.
95. Uppsala konfliktdataprogram
Uppsala Department of Peace and Conflict Research, ofte referert til som UCDP, er vert for en massiv database kalt UCDP Conflict Encyclopedia. Dette er et nettsted som lar brukere klikke seg gjennom og utforske dataene avdelingen allerede har oppdelt. Forskere kan klikkes på gjennom nettsiden og også lastes ned for videre manipulasjon og analyse. Dette er en ressurs som kan stoles på og refereres til for kvalitetsinformasjon distribuert på en tilgjengelig måte.
Det amerikanske arbeidsdepartementet er vert for mange økonomiske data om statistikk om arbeidsledighet og sysselsetting. Naturligvis inkluderer disse tallene databaser som inkluderer masseoppsigelsesstatistikk, sysselsettingsprognoser, ledige stillinger og arbeidsomsetning, nasjonal sysselsettingsstatistikk og til og med internasjonal arbeidssammenligningsstatistikk. Nettstedet gir informasjon som er oppdatert og nøyaktig mens Arbeidsdepartementet holder styr på det hele. Dette er en anerkjent ressurs med statlig støtte for forskningsformål.
97. Småbedriftsadministrasjon
Small Business Administration har lenge vært en velprøvd ressurs for gründere og andre aspirerende gründere. Dette nettstedet er vert for massevis av statistikk om sysselsetting samt informasjon som lar forskere gjøre markedsundersøkelser og konkurranseanalyser. Her kan forskere finne tall, statistikk og verktøy som kan brukes til å avdekke tilleggsdata. For informasjon om småbedriftsstatistikk fra et arbeidsgiver- og bedriftsperspektiv er dette en utmerket ressurs som journalister kan henvende seg til når som helst.
98. Crowdpac
Crowdpac er en plattform som lar politiske kandidater samle inn penger og organisere seg. På grunn av ideen om at det er et antall kongresskandidater hvert valg som i utgangspunktet kjøres uten motstand, lar dette nettstedet engasjerte borgere organisere støtte. Med artikler som diskuterer relevante politiske spørsmål som gerrymandering i forbindelse med tilleggsemner som borgerrettigheter og nasjonal sikkerhet, representerer dette nettstedet en utmerket mulighet til å forstå og finne ut hva som skjer i den politiske grasrotscenen.
99. Gallup
Dette nettstedet er hjemmet til de berømte Gallup-målingene. Gallup spesialiserer seg på analyser som lar organisatoriske beslutningstakere løse problemer gjennom en databasert tilnærming til problemløsning. Dessuten er enheten foreslått av Gallup ofte nyttig for kjøreløsninger. Dette er en kilde som har anerkjennelse som gullstandarden innen data og avansert analyse. Bare bla gjennom nettstedet for å utforske rapporter om alt fra tilstanden til den globale arbeidsplassen til diskusjoner om amerikansk produktivitet.
100. Berkeley bibliotek
Berkeley Library er vert for en fullstendig samling av statistikk og data for statsvitenskapelig forskning på nettstedet. På denne siden vil forskere finne massevis av lenker som gir forskere tilgang til en rekke datasett samt kapasitet til å bygge dine egne. Blant disse er Historical Statistics of the United States (HSUS), Millennial Edition, Data Planet, ProQuest Statistical Insight og Inter-university Consortium for Political and Social Research. Det er flere timer med data å komme gjennom.
For de som ikke vet, er RAND Corporation en organisasjon som spesialiserer seg på forskning på offentlige politiske utfordringer. Med kunder og en portefølje som spenner over alle myndighetsnivåer, er selskapet en kilde til kvalitetsforskning med tanke på beslutningstaking. Den amerikanske avdelingen av selskapet er vert for et sett med databasestatistikk på nettstedet. Her kan forskere finne informasjon om grunnskoleutdanning, helse, næringsliv og økonomi blant andre kategorier som tar opp problemstillinger som er relevante for allmennheten.
102. Ropersenter for opinionsforskning
Roper Center for Public Opinion Research, som drives og drives gjennom Cornell University, spesialiserer seg på å samle inn, distribuere og bevare opinionsdata. Som et eksempel på hva slags informasjon Roper Center kan avdekke, kan forskere ha tilgang til data fra det amerikanske valget samt en lenke til et arkiv med over 23 000 datasett. Enten journalister leter etter offentlig reaksjon på politikk eller på en nylig helsefare, er dette nettstedet nesten sikkert å ha informasjon.
103. Transport Gov
Drevet og drevet av Bureau of Transportation, har dette nettstedet data som spenner over et bredt spekter av transportrelaterte emner. Ressurser på denne siden inkluderer rapporter om energi, passasjersikkerhet, energi, systemytelse, transportøkonomi, infrastruktur og godstransport. Brukere kan til og med sortere og få tilgang til dataene som tilbys på dette nettstedet etter sted og geografi. Dette er et nettsted som lar forskere finne ut alt de kan forvente å vite om transportrelaterte emner.
104. Reisehandel
Travel Trade er et nettsted som er vert for data om amerikanske statsborgeres avganger fra 1996 til 2016 når dette skrives. Det uttalte målet med denne ressursen er å hjelpe interesserte medlemmer av offentlighetens prosess og forstå hvordan global turisme og internasjonal turisme har fungert gjennom årene. Tilgjengelig både for nedlasting og for online visning, er dette en tilgjengelig informasjon. Forskere kan enkelt bruke disse dataene til å finne trender og foreta sammenligninger.
105. Skift
Skift er et nettsted som fokuserer på å levere intelligens og data til reiselivsbransjen. Blant andre datakilder er selskapet vertskap for forskning, konferanser og informative nyhetsbrev for abonnenter og forskere å velge mellom. Skift undersøker emner som enkeltpersoner i reisesektoren ønsker å vite, for eksempel hvor folk i økende grad reiser, identifisering av nye markeder og mye tilleggsinformasjon om reiseteknologi som forskere har muligheten til å utforske.
106. Geoba.se
Geoba.se er det perfekte nettstedet for folk som vil ha fakta og ingenting annet enn fakta om en by eller et sted. Å bruke søkemotoren på hjemmesiden, finne koordinater, informasjon for reise, vær og til og med lokale webkamerabilder er bare noen få enkle tastetrykk unna. Nettstedet er også vert for en side som gir informasjon om verdensrangeringer som kan begrenses etter region og land. Kort sagt, dette er en ressurs som vil gi ren data og statistikk.
107. USA reiser
US Travel er vert for et nettsted som drives og vedlikeholdes av det amerikanske utenriksdepartementet. Det uttalte oppdraget til nettstedet er at det tar sikte på å beskytte livene til amerikanske borgere som skal til utlandet. Som sådan er denne kilden vert for statistikk, informasjon og rapporter om slike emner som amerikanske pass, amerikanske visum, adopsjoner mellom land, dødsfall i utlandet og internasjonale bortføringer av foreldre. Informasjonen kan brukes under planlegging av reiser, men kan også brukes til å identifisere langsiktige trender med statistikken fra 1996 til 2016.
108. UK Data Service
Finansiert av Economic and Social Research Council publiserer UK Data Service Collection et bredt spekter av data. Dette nettstedet har informasjon som inkluderer materiale som forretningsdata til kryssnasjonale undersøkelser, undersøkelser sponset av den britiske regjeringen, og til og med britiske folketellingsdata. I utgangspunktet ble nettstedet designet med tanke på behovene til studenter og forskere. I tillegg er det guider, ressurser og instruksjoner som tilbyr veiledninger og ressurser som hjelper forskere å forstå og bruke verktøyene på dette nettstedet raskt.
109. Data.gov.au
Data.gov.au drives og publiseres av den australske regjeringen og tilbyr enkel tilgang til og søk i åpne data. Dette nettstedet påpeker eksplisitt at myndighetenes data kan brukes til å utvikle verktøy og applikasjoner som igjen kan brukes til fordel for australiere. Ikke bare er det tilgang til de åpne datasettene, men det er også upubliserte data som kan nås mot en avgift. For forskere som ønsker å utføre en enda dypere analyse, tilbyr nettstedet også et Data Toolkit.
110. Twitter
Alle kjenner Twitter for sine raske samtaler, korte meldinger og statusen i populærkulturen som et knutepunkt for siste nyheter. Det mange derimot ikke vet er at Twitter også har utviklerverktøy som gjør det lettere å filtrere og oppdage informasjon. Disse verktøyene lar til og med forskere se trender og filtrere etter geografi. Enten du leser opp på trendende hashtags eller utforsker utviklerverktøyene, er Twitter en ressurs journalister har brukt i ganske lang tid.
111. Instagram
Instagram er ikke bare for å like søte kattebilder og søte babybilder. Eller i det minste trenger det ikke være det. Appen har et overraskende sofistikert sett med utviklerverktøy som gjør det enkelt å forstå og forske på publikum. I tillegg kan hashtags og ledetrådene som avsløres av bildene folk legger ut, samt personene som blir tagget i dem, være en skattekiste av informasjon. Instagram er en nyttig måte å avdekke hva som trender i ulike sektorer.
112. Fire Square
For den typen forskning der plassering er viktig, er Four Square en nyttig datakilde på grunn av den enorme databasen og all informasjonen den har samlet. På overflaten har den en byguide som gir anbefalinger til brukere om styrken til fellesskapet. Four Square har også utviklerverktøy som gir tilgang til tilleggsinformasjon gjennom Places-databasen. Journalister kan bruke dette til å lære mer om spesifikke steder og om personene som bruker appen.
113. New York Times
Ansett av mange for å være et aktet medlem av Fourth Estate, er det svært få journalister som ikke har hørt om New York Times. Det som imidlertid ofte blir oversett, er bruken av New York Times som en datakilde gjennom API-en. Forskere kan finne artikler som dateres tilbake til 1851 etter måned, søke i artikler og til og med finne bokanmeldelser. Denne API-en gjør det mulig å søke basert på visninger, delinger og e-poster og til og med for å finne og få tilgang til kommentarer.
114. AP
Associated Press har en fast plass i populærkulturen som en kilde til aktuelle og nøyaktige nyheter. Takket være utviklerverktøyene er det også en nyttig datakilde for journalister. Når dette skrives, kan forskere bruke disse verktøyene til å lage sin egen redigering mens de laster ned bilder og videoer. Innholdsnivået ser ut til å avhenge av typen plan forskerne bruker, men Associated Press API lar likevel brukerne ta forskningsprosessen til et annet nivå.
115. Fem og trettiåtte
Journalister er kanskje allerede kjent med Nate Silver og Five Thirty Eight og hans statistiske modell på grunn av hans noen ganger uventede, men vanligvis korrekte spådommer. Five Thirty Eight har en GitHub som er vert for datasett samt koding som har blitt brukt i løpet av nettstedets historie. Datasettene inneholder morsomme emner som data om dårlige sjåfører, Avengers og undersøkelsen om flyetikette. Samtidig er det også filer som tar for seg litt mer alvorlige saker som flysikkerhet og hatkriminalitet.
116. IMDb
IMDb anses av mange for å være det mest omfattende nettstedet på nettet med hensyn til film- og skuespillerbransjen. Hvis det kommer ut en film og folk vil vite hvem som spiller i den, eller se den generelle reaksjonen til publikum på film, er sjansen stor for at de kommer til å lande på denne siden på et tidspunkt under søket. IMDb er også vert for en rekke datasett som oppdateres hver dag og er tilgjengelige for kommersiell og ikke-kommersiell bruk.
117. KAPSARC
KAPSARC er en dataportal som er vert for totalt 923 datasett med spesifikk informasjon om energidata. Disse settene er delt inn i noen få generelle temaer innen energibruk, energiforsyning og andre relevante faktorer som politikk, demografi, miljø, handel, vann, annonseøkonomisk informasjon. For forskere som er interessert i energi og hvordan den brukes på tvers av ulike bransjer og sektorer, er KAPSARC en av de mest omfattende energidatakildene på nettet.
118. Eiendelsmakro
Asset Marco er et nettsted som gir historiske økonomiske data og makroøkonomiske indikatorer. Disse dataene dekker mer enn 75 000 aksjer, valutaer, råvarer og obligasjoner over hele verden. I tillegg har nettstedet mer enn 120 000 makroøkonomiske indikatorer som brukere kan bruke for å utforske økonomiske data fra forskjellige land. I tillegg til alle disse finansmarkedsdataene, diskuterer nettstedet også investeringsstrategier. Denne kilden er veldig unik på grunn av den store mengden informasjon som kan bli funnet.
119. US Government Web Services og XML-datakilder
US Government Web Services og XML-datakilder er vert på et nettsted kalt USGovXML.com. Her kan brukere bla gjennom de forskjellige XML-datakildene og nettjenestene som den amerikanske regjeringen har levert. Denne enkle bevaringshandlingen holder disse nettkildene gjennomsiktige og tilgjengelige for publikum. For forskere som regelmessig overvåker denne indeksen generelt, er det mulig å finne en historie i dataene i tilfelle det er en plutselig endring i XML-dataene.
120. Figshare
Figshare er et nettsted som er vert for over 5000 deler av vitenskapelig innhold tilgjengelig for akademisk forskning og sitering. I tillegg til informasjonen der, er nettstedet designet for å tilby forskere et enkelt sted med det formål å kompilere, laste opp, lagre og administrere forskningen de finner. Matematikk, helsevitenskap, ingeniørfag, kjemi, biologiske vitenskaper og samfunnsvitenskap er alle oppført som utvalgte kategorier. Dette nettstedet er en flott kilde for journalister på jakt etter flere akademiske ressurser til nettstedet.
121. LinkedData
LinkedData er et nettsted som er dedikert til ideen om å finne nye måter å koble til Internett-data som ikke var koblet før. Her vil brukerne finne veiledninger, guider og datasett som får historien til å gå rundt. Datasettene fokuserer alle på temaet å involvere seg i det koblede datafellesskapet, og i tillegg til den koblede datahandlelisten, er de fleste kategorisert som utfererbare URIer enten med eller uten det komplementære RDF-formatet. For å lære mer om dette fellesskapet, er dette nettstedet et must-see.
122. Web Miner
Web Miner er det perfekte stedet for forskere som ønsker å samle all generisk data de kan finne med programmet. Dette nettstedet er vert for eksempeldatabaser som amerikanske restauranter, SWIFT-koder fra banker over hele verden, amerikanske bensinstasjoner, amerikanske turistattraksjoner og Google Play-apper blant andre enorme lister. Om ikke annet, er det et nettsted som vil gjøre det enklere og raskere for journalister å sile gjennom og avdekke enorme mengder data på betydelig kortere tid.
123. Data Hub
Data Hub er stolt av å være et sted hvor brukere kan finne og publisere data så raskt og effektivt som mulig. Selve nettstedet er vert for en rekke datasett. Husprisindeksen (Case-Shiller), den månedlige prisen på gull og gjeldende trender i atmosfærisk karbondioksid er de tre mest populære. I tillegg til dataene, er nettstedet også vert for en rekke opplæringsprogrammer som brukere kan gå gjennom for å lære mer om å navigere i de ulike typer tilgjengelige data.
124. Enigma Public
På sin side kaller Enigma Public seg selv som "den bredeste samlingen av offentlige data" tilgjengelig på nettet. Datasettene faller inn i en av fire brede kategorier i FOIA, Essentials, Newsworthy og Under the Radar. Noen av dataene på dette nettstedet inkluderer ansattes lønn i Det hvite hus og aktive føderale skytevåpenlisenser. Etter å ha opprettet en gratis konto, kan brukere få tilgang til hvilken som helst av datakategoriene som er der for visning.
125. Yahoo
De fleste nettbrukere er kjent med navnet Yahoo på grunn av slike som Yahoo! Nyheter og Yahoo! Finans blant selskapets mange nettbaserte eiendommer. Av interesse for forskere og journalister er det faktum at Yahoo også er vert for et stort antall datasett, inkludert Yahoo! Musikkbrukervurderinger av sanger med artist-, album- og sjangermetainformasjon, v. 1.0 og Yahoo! Filmer brukervurderinger og beskrivende innholdsinformasjon, v.1.0 for å nevne to. Journalister på jakt etter ny statistikk kan ikke gå galt med denne kilden.
126. 1000 genom
1000 Genomes er hjemsted for et prosjekt med samme navn som gikk fra 2008 til 2015. Hensikten med prosjektet var å finne hver genetisk variasjon som kunne forekomme i minst 1 % av populasjonene som ble studert. Sammen med publikasjonene som ble til på grunn av dette prosjektet, var det også massive datasett som inkluderte separate databaser med variantceller, råsekvensfiler og prøvetilgjengelighet. Disse dataene kan enten bla gjennom eller lastes ned.
127. CBOE
CBOE er en futuresbørs som primært fokuserer på volatilitetsfutures. Spesielt har nettstedet mye materiale om futures som er omtalt på nettstedets varemerkebeskyttede volatilitetsindeks. Nettstedet er vert for markedsdata av alle slag, inkludert historiske data, daglig markedsstatistikk og VX Futures daglige oppgjørspriser. For journalister som søker kvalitetsmarkedsdata, er CBOE et nettsted som kan gi den informasjonen i et format som er enkelt å følge og forstå.
128. St. Louis Fed
Federal Reserve Bank of St. Louis er en av, om ikke de viktigste, viktige finanssentrene i regionen. På nettstedet kan forskere lese arbeidspapirer, økonomiske data, publikasjoner og informasjonstjenester direkte. Det er med andre ord ingen mangel på informasjon om St. Louis Feds nåværende og tidligere tankegang når det gjelder politikk, så vel som evnen til å evaluere effektiviteten til St. Louis Federal Reserve Bank. For forretnings-, finans- og økonomiske journalister er dette en førsteklasses ressurs for informasjon.
129. OANDA
OANDA er en populær online aksjehandelsplattform, hovedsakelig handel med CFD-er og utenlandsk valuta. På toppen av de mange funksjonene lagt til traderen med den hensikt å tiltrekke seg netthandlere, er OANDA også vert for mange historiske kursdata samt historisk informasjon om valutaomregneren på nettstedet. Sammen med alle disse dataene tilbyr nettstedet også informasjon med investeringsstrategier sammen med nyheter og markedsanalyser. En konto er ikke engang nødvendig for å få tilgang til de fleste av disse dataene.
130. ABS
Australian Bureau of Statistics, eller ABS, ikke ulikt sin amerikanske motpart, tilbyr objektive data, økonomisk informasjon og forskning på et bredt spekter av emner som er relevante for landet. Direkte på selve siden kan forskere slå opp statistiske data om næringsindikatorer, helsevesen, bolig, finans, internasjonal handel, bolig, psykisk helse, samt prisindekser og inflasjon. Journalister kan kjøre søk for å finne eldre undersøkelser og informasjon som også kan sortere informasjon etter region.
131. London-databasen
London-databasen ble opprinnelig unnfanget og drevet av Greater London Authority, og er Londons forsøk på å gjøre Londons data mer tilgjengelig for publikum. Sluttmålet er å gi folk tilgang til denne informasjonen samtidig som de oppmuntrer dem til å bruke den gratis på den måten de vil. På denne nettsiden kan brukere søke i data etter emner som kunst og kultur, kriminalitet og samfunnssikkerhet, utdanning og helse. Journalister som er interessert i denne typen data kan nå få den direkte fra kommunen.
132. Statistikk NZ
Regjeringen i New Zealand er vertskap for massevis av statistikk og data for forskere å grave i og analysere på dette nettstedet. Denne informasjonen kan siles gjennom ved å bruke søkefeltet øverst, ved å filtrere etter sted og region, samt etter emne. Noen av temaene inkluderer økonomiske indikatorer, helse, inntekt og arbeid, industrisektorer, miljø og næringsliv. Mellom de ekstra nyhetskildene og utgivelsene som fremhever ulike funn og statistikker, vil journalister avdekke all slags New Zealand-spesifikk statistikk gjennom dette nettstedet.
133. Australian Government Bureau of Meterology
Drives og drives til syvende og sist av regjeringen i Australia, Australian Bureau of Meterologys nettsted inneholder værinformasjon som gjelder de forskjellige byene og regionene i Australia. Per nettstedet ble dette byrået etablert som et middel til å hjelpe australiere med å takle klimaet rundt dem gjennom en kombinasjon av advarsler og råd. Her vil forskere kunne finne sesongutsikter, vannlagring, nedbørsprognoser, klimavariasjoner og sesongmessige strømningsprognoser. På denne siden finner du nøyaktig og anerkjent dekning av australsk vær.
134. Gruppelinse
Dette nettstedet er på nettet med tillatelse fra GroupLens ved University of Minnesota's Department of Computer Science and Engineering. Nettstedet tilbyr publikasjoner så vel som datasett for forskningsformål. Det er totalt rundt seks datasett. Blant de navngitte settene vil det være noen med tittelen Book-Crossing, MovieLens og HetRec 2011. Kort sagt, dette er en nyttig ressurs for journalister som ønsker å bedre forstå hvordan de kan bruke dataene som er gitt.
135. KD Nuggets
KD Nuggets er et nettsted som først og fremst fokuserer på å gi folk datavitenskap, forretningsanalyse, maskinlæring og datautvinning. Det er en side på nettstedet som har en komplett liste over datasett som folk bruker for å gjøre mer utforskning av datautvinning og store data med datasett som Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett og Datamob som alle er koblet til. Dette er en fantastisk ressurs for journalister som foretrekker å ha all informasjon på én side.
137. Microsoft
Alle som har brukt en PC eller en bærbar PC har sikkert hørt om Microsoft i det minste i forbifarten. Interessant nok, på toppen av PC-er, bærbare datamaskiner og programvare, er Microsoft også vert for mye forskning og publikasjoner. Dette inkluderer gjennombrudd som selskapets søken etter å lage lese- og skrivemaskiner samt skybasert datavitenskap. Det er også tilleggsinformasjon om verktøy Microsoft utvikler som Visual Studio Code Tools og utviklingen innen AI som de representerer.
138. RDataMining
Akkurat som det står på tinnet, er R Datamining en ressurs på R og datamining. Nettstedet gir en rekke eksempler og dokumenter som gir et dyptgående perspektiv på data mining og data mining med R. I tillegg er det også lenker til opplæringskurs som kortkurset som tilbys av University of Canberra. Dette inkluderer lenker til gratis datasett og presentasjoner så vel som datasett som dekker emner som fly-, flyselskaps- og rutedata, samt lenker til nettsted som GeoDa.
139. Collaborative Research in Computational Neuroscience – Datadeling
Collaborative Research in Computational Neuroscience, også kjent som CRCN, har en rekke datasett som kan nås via nettstedet deres. Datasettene er kategorisert etter de ulike delene av hjernen som den visuelle cortex, hippocampus, den motoriske cortex, fugl, øyebevegelser og aplysia som bare noen få eksempler. Disse mappene inneholder også utfordringer, verktøy, simuleringer og metoder. Muligheten til å dele disse dataene gjør det til en enda bedre ressurs å bruke til forskning.
Ifølge nettstedet har Protein Data Bank-arkivet vært en ledende ressurs på nukleinsyrer, 3d-strukturene til proteiner og komplekse sammenstillinger siden 1971. Utformet med det eksplisitte oppdraget å holde denne informasjonen offentlig, kan forskere gå hit for å se validering rapporter og dataordbøker på nett. Det er også datavekst og bruksstatistikk tilgjengelig for nettbasert sortering og analyse samt for nedlasting. Det beste av alt er at nettstedet alltid legger til ny informasjon.
141. PubChem-prosjektet
PubChem som et offisielt prosjekt ble designet med det formål å informere publikum om hva små molekyler er i stand til å gjøre fra et biologisk synspunkt. Nettstedet er koblet til av tre databaser inkludert PubChem Compound, PubChem Substance og PubChem BioAssay. I tillegg gjør siden det også mulig å søke etter likhetene mellom ulike proteiner. For forskere som tar dataanalysen til neste nivå, tilbyr nettstedet også gratis koding og tips.
142. Coremine Medical
Coremine Medical er en uvurderlig ressurs for alle som søker etter informasjon om biologi, helse og medisin. Nå som den biomedisinske tekstgruvefunksjonen til PubGene har blitt rullet inn i sin nåværende form, er Coremine også en av de mest fleksible kildene til biomedisinsk informasjon som finnes. Dette nettstedet vil vise koblinger mellom konsepter og ideer i et visuelt engasjerende, lett forståelig format som kanskje ikke har blitt lagt merke til ellers. Det er lett en av de mest omfattende biomedisinske datakildene som er tilgjengelige for journalister.
143. Tu Tiempo
Tu Tiempo er en utrolig kilde til vær- og klimadata for alle land i verden. Ved å bruke denne ressursen er det enkelt å finne årlige, månedlige og daglige gjennomsnitt for praktisk talt alle byer og regioner i verden. I tillegg kan brukere også søke gjennom databasen med over 115 millioner poster fulle av historiske data som enhver person kan søke gjennom. Avhengig av regionen det søkes om, er det mulig å finne data som går så langt tilbake som 1929.
144. Komplekse nettverksressurser
Dette er et nettsted som gir tilgang til ganske mye av dataene som først ble brukt i sine datamaskinbaserte eksperimenter. Den fullstendige listen over datasett som viser typene data, inkludert nyhetsgrafer, biologiske grafer, siteringsgrafer, samarbeidsgrafer, konstruerte grafer og semantiske grafer. Siden lenker også til en liste over kilder som inneholder mye informasjon, for eksempel datasettet som undersøkte omtrent 3 millioner amerikanske patenter. Siden har også en imponerende samling av komplekse nettverksdatasett.
145. Scopus
Scopus er et verktøy som lar enkeltpersoner raskt og enkelt finne forskning og akademiske sitater. Nettstedet tilbyr en utrolig omfattende database med forskning som har funnet sted rundt om i verden på en rekke felt som inkluderer sektorer som medisin, teknologi, samfunnsvitenskap og kunst og humaniora. Bruk Scopus til å fange opp akademisk kilde som kanskje har blitt oversett. Tross alt, i mange kretser kan kvaliteten på en akademisk kilde være nesten like viktig som informasjonen den gir.
146. Stanford
Stanfords rykte som en prestisjefylt akademisk institusjon skjedde ikke tilfeldig ut av det blå. Fortreffelighet viser gjennom i sine programmeringsrelaterte kurs. Nettstedet er også vert for en rekke datasett som inkluderer detaljer som informasjon om sosiale nettverk. Det er datasett som sentrerer om sosiale kretser på Facebook, Wikipedia admin forespørsel, Twitter sosiale kretser og Google+. Kommunikasjonsnettverk og Amazon Product Network har også egne datasett.
Universitetet i Milanos avdeling for informasjonsvitenskap driver og driver en nettside kjent som Laboratory for Web Algorithms. Dette nettstedet er hjemsted for mange datasett som er der for å utforske. Disse inkluderer grafer i forhold til sosiale nettverk, Facebook-grafer, øyeblikksbilder fra DELIS-prosjektet og en kort liste over diverse data. Informasjonen som er tilgjengelig her kan ses online og lastes ned hvis du velger det, noe som gjør dette til et av de mest tilgjengelige datasettene av sitt slag på nettet.
148. UCI Network Data Repository
UCI Network Data Repository er et nettsted som er dedikert til å ta en vitenskapelig tilnærming til studiet av nettverk. På ressurssiden vil forskere finne lenker til datasettkataloger valgt av forskningsorganisasjoner og grupper så vel som av enkeltpersoner. Den har også en samling av datasett som vanligvis vil bli brukt til analyse av sosiale medier. De som graver i dataene vil gjerne finne at disse settene også er tilgjengelige for nedlasting.
149. CAIDA
CAIDA, eller Center for Applied Internet Data Analysis, samler inn et bredt spekter av data fra en rekke forskjellige steder, ofte med bistand fra forskjellige organisasjoner og enkeltpersoner. Det finnes datasett på denne siden som AS Relationships, DDOS Attacks, Telescope og dets relaterte sammen med andre data. Kategoriene inkluderer trafikk, topologi, sikkerhet, ormesammendrag og trafikkoppsummeringsstatistikk. Datasett kan kreve tilgang, men mange, om ikke de fleste, er offentlige.
150. Crawdad
Crawdad, eller Community Resource for Archiving Wireless Data At Dartmouth, er unik på grunn av sitt fokus på å gi trådløse data til forskere og andre som kan ha interesse for emnet. Nettstedet tilbyr en rekke verktøy samt tilgang til en rekke datasett. Blant settene som er oppført, er de som refereres til pedagogisk bruk, karakterisering av bitfeil, nettverksdiagnose, opportunistisk tilkobling, stedsbevisst databehandling og mer å velge. Forskere vil sette pris på denne ressursen jo mer de dykker ned i den.
151. US Energy Information Administration
Ofte referert til som EIA, er US Energy Information Administration i bransjen med å levere årlige data om strømforsyning til publikum. Informasjonen i disse dataene dekker fossilt brensellagre, drivstofforbruk, månedlig og årlig informasjon om generering av elektrisitet og miljødata blant andre alternativer. Dataene er der og tilgjengelig for analyse fra årene 2001 til 2017. Alt forskerne trenger å gjøre er å navigere inn på siden og laste ned informasjonen.
152. Britiske oseanografiske data
British Oceanographic Data er finansiert av National Environment Research Council og er en av de mest tilgjengelige kildene til marine data på Internett. Med en omfattende database som berører strømmer, CTD-profiler, internasjonale havnivådata, strømmer og til og med historiske bunntrykkregistreringsdata. I tillegg er det datasett å finne i Publisert databibliotek som gir ekstra tilgang til katalogen. Dette er muligens en av de mest omfattende kildene til marin informasjon tilgjengelig på nettet.
153. Saklig
Factual gir plasseringsdata for annonsering og for bruk på mobile plattformer. Av spesiell interesse for forskere er utviklerverktøyene som inkluderer Engine Mobile SDK og de fullstendige profesjonelle og forskningsapplikasjonene til Observation Graph samt Local Validation Stack. Med et nettstedsbetegnelse som understreker selskapets lidenskap for å ta data rundt om i verden og finne nye måter å sette dem i sammenheng, har Factual en klar forpliktelse til data og å finne nye og uortodokse muligheter for å bruke dem.
154. Globale administrative områder
Global Administrative Areas er en geodatabase som viser hvor de ulike administrative områdene i verden ligger. Dataene som samles inn fra denne typen databaser brukes da typisk i geografiske informasjonssystemer. Disse vil inkludere land og er videre delt inn i blant annet provinser, fylker og avdelinger. Den gode nyheten for journalister er at alle disse dataene er tilgjengelige gratis og kan også brukes til akademisk og generell ikke-kommersiell bruk.
155. Geonames
Geonames er et nettsted som er hjemmet til en geografisk database med millioner av oppføringer, unike funksjoner og alternative navn. Tilbyr både et eksportalternativ og tilgang gjennom en rekke webtjenester, er dette en database som behandler omtrent 150 millioner forespørsler hver dag. Takket være databasens wiki-funksjoner kan brukere gjøre justeringer og endringer i databaseoppføringene relativt enkelt. Dette er en stor ressurs for flerspråklige vertskapsfunksjoner alene.
156. Naturlige jorddata
Natural Earth Data er et kartdatasett som er tilgjengelig i det offentlige domene og fullt av informasjon designet for bruk i kartprogramvare for å lage toppmoderne kart. Det visuelle til sluttproduktet er ryddig og godt organisert, og dataene kan brukes umiddelbart. Dette datasettet inkluderer tilstedeværelsen av etterretningsdata og ulike kulturelle, raster- og fysiske vektordatatemaer. Opprinnelig laget med kartografers behov og preferanser i tankene, er dette datasettet nyttig for alle med interesse for geografi.
157. Openstreet kart
Openstreet Map er mindre et nettsted og mer et samarbeid mellom brukere som nå leverer karttjenester til apper, nettsteder og ulike maskinvareenheter. Dette nettstedet henter inn nye data når brukere legger inn informasjon om mindre kjente landemerker som jernbanestasjoner, veier og stier. Hele datasettet er tilgjengelig gratis på nettstedet og kan lastes ned enten helt eller delvis. For de som velger å gjøre en delvis nedlasting av dataene, er det mulig å laste ned etter region også.
158. Byen Chicago
City of Chicago er hjemmet til Michael Jordans mesterskap Bulls og sin egen unike pizzastil, og den har også en egen komplett dataportal. Datasettkategorier spenner over en rekke emner som inkluderer administrasjon og finans, etikk, helse og menneskelige tjenester, parker og rekreasjon, offentlig sikkerhet og historisk bevaring. Kort sagt, City of Chicagos dataportal er vert for praktisk talt alt som vil være av interesse for forskere, beslutningstakere og lokale journalister.
159. CKAN
CKAN er i hovedsak netthjemmet til City of Glasgows åpne dataprosjekt. Dette nettstedet har datasett om en rekke emner som er nyttige for gründere, beslutningstakere, akademiske forskere og apputviklere å bruke. Av de 360 datasettene som er vert her, er noen relatert til bystyre, som datasettet for husmasse etter eiendom, mens andre som sykkeldatasettet er av spesiell interesse for lokale innbyggere. Det er all slags informasjon her for journalister som dekker en mer lokal beat.
160. Indias regjering
Regjeringen i India har et nettsted som dekker analyse- og dataressurser i sin versjon av Open Data Project. For øyeblikket er det omtrent 137 940 ressurser som har blitt sett millioner av ganger på nettstedet. Det store flertallet av disse filene er også tilgjengelige for nedlasting på nettstedet. Enten du leter etter tall på statsbudsjettet eller søker etter datasett som tar for seg helse og familievelferd, er sjansen stor for at dette nettstedet vil ha ressurser å tilby.
161. Stats SA
Denne siden er full av oppdatert statistikk, publikasjoner og data samlet inn av den sørafrikanske regjeringen. Her skal forskere avdekke informasjon om alt fra mat- og drikkeundersøkelser til økonomiske indikatorer, sysselsettingsstatistikk, befolkningstall og viktig helsestatistikk. Det er mulig å søke i tallene etter by, tema og indikator avhengig av hva som trengs. Dette nettstedet er vert for mye informasjon om folketellingen, samtidig som det gir ut statistiske publikasjoner, spørreskjemaer, koder og klassifiseringer og prispolitikk.
162. Politikkutvikling og forskning
Dette nettstedet er publisert under paraplyen til US Department of Housing and Development's Office of Policy Development & Research. Den publiserer et stort antall casestudier, halvårlige publikasjoner og tidsskrifter regelmessig hvert år. Den tilbyr også et stort antall datasett som journalister vil være interessert i, med rettferdige markedsleie, inntektsgrenser, fornyelsesfinansiering Inflasjonsfaktorer som bare noen av settene publikum har tilgang til på denne siden.
163. Vital Net Health Data
Hos Vital Net Health Data vil forskere finne mange store helserelaterte datasett. Dette nettstedet er ikke så mye vert for alle disse settene, så mye som å tilby lenker til sett som folk kan besøke og finne informasjon gjennom. Denne kuraterte listen lenker til ressurser som CDC Wonder, Eurocat, Health Data All Star, og også arbeidet til veldedige organisasjoner som North American Association of Central Cancer Registries. Dette er uten tvil en av de mest omfattende ressursene for helsedatasett der ute.
164. Analytisk bro
Analytic Bridge er en ressurs som er dedikert til forretningsintelligens. Her vil forskere finne diskusjoner om maskinlæring og AI, lenker til webinarer og konferanser, og til og med en jobbsøk-fane. Siden er også vert for Data Science Central, som er den delen av nettstedet som fokuserer på big data. Med sitt aktive og engasjerte fellesskap og sitt engasjement for å gi nyheter og informasjon, vil journalister med interesse for implikasjonene av data for virksomheten kunne tjene mye på dette.
165. Archive.org
archive.org er først og fremst kjent for sin innsats for å bli et nettbasert offentlig bibliotek, og er hjemsted for en rekke publiserte verk samt en betydelig datasettsamling. Nettstedet kan skryte av resultater fra 2012 Internet Census så vel som Dark Net Market-arkiver fra 2011 til 2015, og til og med et datasett med offentlige Reddit-kommentarer. Det er datadumper fra Music Brainz og et datasett som inneholder lydforsidebilder. Mellom publikasjonene og dataene har archive.org rikelig med materiale for journalister å gå gjennom.
166. Akademiske torrenter
Denne nettsiden omtaler seg selv som et system designet for å gjøre det enklere å dele og laste ned enorme datasett. Ved å bruke torrent-teknologi for å forenkle distribusjonen av data, er Academic Torrents stolte av å la forskere laste ned alt de trenger raskt. Nettstedet er også vert for papirer, kurs og samling for visning. Et raskt søk gjennom ressursene som er tilgjengelige vil avsløre at det er tonnevis av datasett og samlinger tilgjengelig for nedlasting her.
167. Dataverse
Den beste måten å nærme seg Dataverse på er å tenke på det som en annen type bibliotek. Her kan forskere enkelt søke etter, oppdage og sitere data samtidig som de bruker dette nettstedet som et oppbevaringssted for sin egen informasjon. Fagstoffet som dekkes inkluderer felt som samfunnsvitenskap, landbruksvitenskap, medisin, helse og biovitenskap, samt jord- og miljøvitenskap. Store navn med publikasjoner på dette nettstedet inkluderer Gallup og US Department of Commerce, Bureau of Census, Geography Division.
168. UC DATA
UC Data, som opererer i forbindelse med UC Berkeleys Social Science Data Lab, er universitetets største og mest kjente arkiv. Dette nettstedet tilbyr tilbud innen områdene statistikk og samfunnsvitenskapelige data. På dette nettstedet kan forskere få tilgang til papirene, rapportene og arbeidspapirene produsert av UC Data-forskerne. Rådataene dekker en rekke forskningsområder som inkluderer helsevesen, velferd og sosialforsikring, demografi, stemmegivning og informasjonsteknologi blant en rekke andre emner.
169. Joke Camp
Joe Kamp tilbyr en fullstendig guide for å finne fotball- og fotballdata og API-er for dataanalyseformål. Hvis forskere følger koblingene på siden, er det åpen kildekode-data tilgjengelig gjennom GitHub samt tilgang til gratis og kommersielle API-er for enklere tilgang. Siden dataene og kodingen er tilgjengelig på et godt anerkjent nettsted som GitHub, har det aldri vært enklere å få tak i denne typen data.
170. Sean Lahman
Sean Laham er ikke nødvendigvis et navn folk hører hver dag, men siden hans er hjemmet til en av de mest omfattende og dyptgående batting- og pitchingstatistikkene på Internett. Med tall som dekker perioden fra 1871 til 2016, går dataene bokstavelig talt århundrer tilbake. Data er gratis å få tilgang til og bruke under Creative Commons Share Alike 3.0-lisensen og kan lastes ned direkte i SQL og Microsoft Access for å nevne noen. Statistikken kan også lastes ned via GitHub.
171. Retro ark
Retro Sheet er en av de mest omfattende kildene på Internett for baseballstatistikk og data. Nettstedet inneholder detaljer som årlige lister og identifikasjon av dommere, spillere og trenere. For årene det var relevant, ble dataene for all-star-spillet inkludert i hendelsesfilene sammen med et sett med hendelsesfiler for ettersesongen og en liten avviksfil. Retro Sheet har til og med identifikasjoner for ballparker for hver sesong. Hvordan er det for grundig?
For de som ikke er så kjent med programmet, er Hubway navnet på sykkelandelen som er basert i hovedstadsområdet Boston. Selvfølgelig registrerte og ga ikke systemet identifiserende informasjon, men Hubway har likevel grunnleggende informasjon om hver tur som noen gang ble tatt mellom juli 2011 og september 2012. Dette inkluderte detaljer som start og slutt på turen samt hentestasjonen for å nevne noen kategorier.
173. Åpne flyreiser
Open Flights er en database som har informasjon om mer enn 10 000 fergeterminaler, flyplasser og togstasjoner rundt om i verden. Forskere kan finne den Excel-kompatible .csv-versjonen gjennom GitHub og kan også laste ned dataene direkte på nettsiden. Ved å bruke kartet på hjemmesiden er det mulig å se hvilke spesifikke steder som er på listen, og siden går til og med så langt at den også har ruteinformasjon tilgjengelig. Nettstedseierne kan kontaktes for enda mer oppdatert informasjon.
174. MLVIS
MLVIS er et datalager som kombinerer visuell analyse med datautvinning i sanntid. Dette gjør det mulig å utforske mer intuitive forståelser av data selv mens du arbeider med enorme datasett. Referansedata og ikke-relasjonell maskindatalæring sammen med forskjellige datatyper som tilskrevet og heterogen er blant de mange funksjonene og alternativene som er tilgjengelige gjennom dette nettstedet. For ekstra bekvemmelighet for brukerne kan denne informasjonen også lastes ned til ett enkelt konsistent format.
175. Åpne Data Inception
Open Data Inception er et nettsted som tilbyr lenker til godt over 2600 dataportaler. Ved å bruke søkefeltet på toppen kan forskere søke etter portaler og datasett etter kategori og tema. I tillegg er det også mulig å bruke nettstedet som et middel til å finne den mest oppdaterte versjonen av datasettet det søkes etter. Dra nytte av muligheten til å se dataportaler i listeformat eller i interaktiv visuell form og begynn å finne de nødvendige dataene.
176. OpenDataSoft
Tilgjengelig på fransk, engelsk og tysk, OpenDataSoft er en kilde som tilbyr tilgang til 480 millioner poster, 4 millioner API-celler og 9 284 datasett. Ved å bruke søkefeltet midt på hjemmesiden kan forskerne skrive inn et nøkkelord eller kategori og finne det mest passende datasettet derfra. For journalister er dette en raskere måte å finne de mest relevante datasettene som trengs for å fullføre den aktuelle forskningen. Besøk nettstedet for å lære mer.
177. Nasjonsmester
NationMaster er en kilde til fullstendig kompilerte data fra over 300 land som har blitt organisert i over 5000 kategorier. Dataene dekker tall som inkluderer tall på prosentandelen av dødsfall som er registrert, statistikk fra andre verdenskrig og til og med informasjon om atomkrig og testing. Forskere vil også finne tabeller, grafer og sektordiagrammer som vil tillate ytterligere visualisering av dataene. Enkelt sagt er det så mange emner som dekkes at det alltid er noe nytt å finne i dataene.
178. Followerwonk
Twitter har lenge vært et populært nettsted for sosiale medier for siste nytt og for å finne trendhistorier. Followerwonk lar brukere ta Twitter-bruken sin til neste nivå. Dette inkluderer å finne Twitter-brukere å koble til, studere nåværende følgere og planlegge Twitter-aktivitet for maksimale resultater. I disse dager er det mange journalister og journalister på Twitter som bruker nettstedet til å bygge nettverk og få historier der ute. Followerwonk gjør Twitter-brukere mer produktive på nettstedet.
179. Infochimps
Infochimps er et nettsted som tilbyr skybaserte tjenester som kan skaleres tilbake for å få mest mulig ut av big data. Det er nyttig når det kommer til å distribuere og integrere stordatateknologi og -applikasjoner. Når forskere søker gjennom enorme mengder data eller vurderer trender i big data, er dette en uvurderlig ressurs å ha. Det er også mange hvitbøker og saker tilgjengelig for forskere å se på nettstedet.
180. Arkivert nasjonal statistikk
Archive-It ble grunnlagt i 2006 og er en tjeneste levert av Internet Archive. Denne tjenesten hjelper organisasjoner og bedrifter med å lage digitale samlinger, og som et resultat har den hatt muligheter til å jobbe med ideelle organisasjoner, høyskoler, universiteter og myndigheter. Forskere kan søke i noen av de forskjellige arkivene på nettstedet, for eksempel nettsteder fra 2014 kongresskandidatløpet, Alabama State Archives og Canadian Government Information PLN Web Archive. Denne siden er en skattekiste av informasjon for driftige journalister.
181. Civic Commons
Civic Commons har en side som viser de ulike regjeringens åpne datainitiativer. Denne søkbare listen over ressurser er organisert etter land, by, region, og nevner til og med ressursene som er gjort tilgjengelige av mellomstatlige organisasjoner. For journalister representerer dette nettstedet en raskere måte å finne ut hvilke myndigheter som deltar i Open Data Project. Dette nettstedet gir også tilgang til deler av lokaliserte data som ikke nødvendigvis kommer opp i et enkelt Google-søk.
182. Guardian World Governments
The Guardian er et kjent navn i journalistikkens verden for sitt rykte for siste nytt. Det mindre folk innser er at nettstedet har en seksjon som tilbyr data om og om myndigheter rundt om i verden. Det er artikler om virkningen av antall hjemløse, diskusjoner om cybersikkerhet, og til og med gjennomtenkte diskusjoner om rollen som data og statistikk må spille i det nåværende politiske og sosiale klimaet. The Guardian's World Government-seksjon er i stand til å sette i gang diskusjoner og finne vinkler for historier.
183. Åpne myndighetsdata (hub)
Denne siden tilhører en gruppe via Open Knowledge Foundation med mål om å oppmuntre og støtte fortsatt utvikling av åpne offentlige data. Her vil brukerne oppdage lenker til en av de mest omfattende listene over åpne datakataloger som er tilgjengelige. Blant de tilleggsmålene som er nevnt på nettstedet, søker gruppen også å finne informasjon om retningslinjer, beste praksis og retningslinjer. Det gir journalister omfattende tilgang til mer og bedre informasjon.
184. Åpen regjering – Frankrike
Denne nettsiden er netthjemmet til det åpne dataprosjektet som tilbys av Frankrikes regjering. Det er mulig å grave i dataene ved å søke under kategorier som sysselsetting, landbruk, utdanning, reise og turisme. Dette er data som gjør det mulig å bygge og utvikle en mer nyansert forståelse av hva dataene faktisk sier samtidig som det gir rom for sammenligninger basert på den historiske informasjonen. I utgangspunktet har journalister all grunn til å være begeistret for å gå gjennom disse dataene.
185. Universitetet i Notre Dame
Dette nettstedet lagrer forskningsdataene som er tilgjengelige gjennom University of Notre Dames bruk av SourceForge.net. Dataene tilbys gjennom relasjonsdatabaser. De månedlige datadumpene gjør det også mulig å få en bedre forståelse av åpen kildekode-programvare og dens applikasjoner. For å få tilgang til denne informasjonen må forespørsler om tilgang gjøres skriftlig via e-post. Haken er imidlertid at vitenskapelige og akademiske forskere er de eneste som er kvalifisert for tilgang til dataene.
186. UFO-rapporter
National UFO Reporting Center har en online database som beskriver folks erfaringer med uidentifiserte flygende objekter. Forskere kan strømlinjeforme databasesøket sitt ved å bruke hvilken som helst av fire kategorier i datoen, formen på UFOen, den publiserte datoen og til og med etter stat. UFOer er unike fordi de aldri klarer å fange fantasien til publikum. Hvis det har vært noen nylige møter av den tredje typen i nærheten, er dette stedet for å finne ut hva folk har sagt.
187. WikiLeaks
WikiLeaks er beryktet og beryktet i media på grunn av kontroversene og det lekkasjene har avslørt om den indre funksjonen til regjeringen og andre kjente og mektige personer i samfunnet, og har et rykte som går foran det. Selv om datadumpene sjelden slippes stille, er det ingen som stiller spørsmål ved nøyaktigheten til informasjonen. For journalister på jakt etter historier som umiddelbart vil tiltrekke seg interesser, er WikiLeaks en velprøvd kilde. Om ikke annet, blir det interessant lesning.
188. Washington Post
Avisen er allerede kjent som en utmerket kilde til siste nyheter og meningsartikler, men få mennesker vet at Washington Post gir tilgang til rådataene som ofte er nevnt i artiklene. På datasiden kan forskere finne data i kategorier som utdanning, folketelling, helse og sikkerhet, transport og utvikling, historiske VM-databaser og til og med tall knyttet til regjering og politikk. Enkelt sagt, å ha tilgang til disse tallene hjelper folk med å utvikle en mer konkret forståelse av problemene i nyhetene.
189. Klimadata
Climate Data er et datasett som gir omfattende informasjon om global temperatur. I det nåværende formatet kan brukere se hver viktig del av klimainformasjonen gjennom rutenettene, samtidig som de kan se hva gjennomsnittene er. For de som søker etter følgedataene, er det mulig å få tilgang til den samme informasjonen for land og hav også. Denne informasjonen kan lastes ned, men for enkelhets skyld kan den også sees direkte på siden også.
190. Proteinstruktur
Protein Structure er en kilde som søker å undersøke hvordan datanettverk kan brukes i forbindelse med biologi. Siden er vert for et depot med data som kan nås via lenkene som er gitt. Av spesiell interesse for medlemmer av forskningsmiljøet er hvordan nettstedet inkorporerer flere ideer som modellanalyse og kjørbar biologi i jakten på dette målet. For journalister er dette nettstedet vel verdt å se på for å observere fremgang og undersøke data.
191. Analyser undersøkelsesdata gratis
Ved hjelp av dette nettstedet kan brukere ta et kurs i å analysere undersøkelsesdata uten å måtte betale for privilegiet. Analyser undersøkelsesdata gratis med den detaljerte innholdsfortegnelsen, inkluderer seksjoner med titler som kart og undersøkelseskunst – vektet vedlikehold, balansering av respondentkonfidensialitet med presisjon for variansestimering, strukturelle ligningsmodeller (SEM) og komplekse undersøkelsesdata. Nettstedet tilbyr en flott oppfriskning for de som forventer å håndtere flere statistiske data i fremtiden.
192. UCLA
På UCLA wiki-siden vil forskere finne en rekke datasett tilgjengelig for demonstrasjonsformål. Det er nok av simulerte og observerte data å velge mellom. Ved å bruke disse ressursene er det mulig for folk å bruke denne ressursen til å avdekke klimadata, befolkningsdata, biomedisinske data, nevrobildedata, amerikanske folketellingsdata, valgdata og økonomiske data blant en rekke andre kategorier. Til syvende og sist er disse datasettene en ressurs som mange mennesker kan ha nytte av å bruke.
På sin side tilbyr University of Toronto forskere tilgang til det det kaller Delve-datasettene. Disse datainnsamlingene var en del av et større produkt designet med det formål å gjøre sammenligninger mellom læringsmetodene. Til syvende og sist er denne informasjonen der for utvikling og evaluering av de ulike tilnærmingene til læring. Kort fortalt er dette en solid kilde for forskere som ønsker å bedre forstå hvordan man analyserer og håndterer datasett.
194. Naturressursverntjeneste
Natural Resources Conservation Service har et nettsted som konsentrerer seg om å fremme bevaring, samtidig som den tilbyr informasjon om de forskjellige mosene, hornvortene, karplantene, lavene og levervortene som finnes i USA. Dette nettstedet er vert for en full database med planter og bilder av planter som kan finnes på nettstedet for å gå med tonnevis av informasjon. Forskere kan laste ned databasen og finne tonnevis med informasjon om emner som alternative avlinger. I hovedsak har denne nettsiden alt folk trenger å vite om planter.
195. Landbruksforskningstjenesten
Som det kan antas ut fra navnet på byrået, håndterer denne tjenesten forskningsbehovene til det amerikanske landbruksdepartementet. Hver gang et landbruksproblem oppdages, er dette den delen av regjeringen som mest sannsynlig bidro til å finne en løsning. Nettstedet er vert for en rekke datasett som kan åpnes og lastes ned direkte. Journalister kan også bruke denne siden til å finne alle de siste nyhetene i forhold til problemstillinger som berører landbruket.
196. Cellebildebibliotek
Dette nettstedet tilbyr et offentlig bibliotek som tilbyr ressurser, informasjon og tilgang til bilder og animasjoner som skildrer celler og cellulære prosesser. Cellen er designet med tanke på den doble prosessen med forskning og utdanning, informasjonen her er nesten alltid relevant under diskusjoner om folkehelse og sykdom. Materialene kommer fra en kombinasjon av kilder, inkludert historiske og moderne publikasjoner. For en grundig forklaring som forenkler kompliserte biologiske prosesser, kan ikke journalister gå galt med Cell Image Library.
197. Komplett genomikk
Dette er stedet for et selskap som anser seg selv som en etablert del av bioteknologiområdet innen sekvensering av humant genom. Interessant nok har Complete Genomics gjort ganske mange av hele genomsekvensene sine tilgjengelige for publikum. Til syvende og sist gir dette all slags nyttig innsikt om DNA og det sekvenserte menneskelige genomet. Den eneste betingelsen for dette materialet er at forskere som bruker denne informasjonen sørger for å gi Complete Genomics ordentlige referanser.
198. Array Express
Array Express er et depot som lagrer informasjon fra resultatene av genomiske eksperimenter som krevde enorme mengder sekvensering eller prosessering. På dette nettstedet vil brukere finne over resultatene av over 70 000 eksperimenter for mer enn 2 millioner essays i flere terabyte med datalagre. Enda bedre, denne informasjonen er gratis for gjenbruk til forskningsformål. Dette er en flott ressurs for all den nyeste informasjonen om genomikk og fremskritt som gjøres på feltet.
199. Kode
Encyclopedia of DNA Elements, eller ENCODE Consortium, er et resultat av forskningsgrupper fra hele verden som jobber i samarbeid med hverandre. Til syvende og sist er målet å kompilere en liste over alle funksjonelle deler av genomet som inkluderer nøye undersøkelse av RNA-nivåer, protein, elementene som regulerer celler og aktiviteten til gener. Det er data som kan søkes gjennom, samt et leksikon som gir mer informasjon.
200. Ensemble Genomes
Ensemble Genomes er et nettsted etablert i 2000 som omhandler genomene til virveldyr. I løpet av årene har denne ressursen lagt til ledsagerinformasjon om virvelløse metazoaner, planter, bakterier og sopp. Dataene om alle disse emnene kan finnes og få tilgang til ved å klikke gjennom lenkene som er tilgjengelige på nettstedet. Dette nettstedet har opplæringsprogrammer, datasett om alle emnene som dekkes, og en samling dokumenter du kan bla gjennom. Alle disse faktorene gjør Ensemble Genomes til en fantastisk datakilde for journalister.
Gene Ontology er et nettsted som eksisterer for det uttrykkelige formålet å finne en måte å representere den nåværende forståelsen av hvordan gener fungerer ved hjelp av datamaskin. Den har en rekke publikasjoner samt tilleggsdokumentasjon som folk kan lese. Det er annoteringer direkte på nettstedet. Den gode nyheten for forskere som ønsker å se nærmere på tall og rådata er at det er filer tilgjengelig for nedlasting direkte på nettsiden.
202. Bibliotek med integrerte nettverksbaserte mobilsignaturer
Harvard Medical School LINCS Center eksisterer med det formål å hjelpe forskningsmiljøet og allmennheten til å lære mer om hvordan menneskelige celler reagerer når de har blitt forstyrret av narkotika. Ved å bruke HMS LINCS-databasen og prosjektutforskerverktøyet kan forskere finne publikasjoner og prosjektsammendrag samt generelle ressurser. Journalister kan også bruke denne siden for å få tak i alle de siste nyhetene og informasjonen som kommer ut av denne forskningen.
203. Human Genome Diversity Project
Human Genome Diversity Project har gjort store fremskritt gjennom innsatsen til Stanford Human Genome Center. Nettstedet har prøver som har tusenvis av prøver og markører. Det viser seg at disse kan lastes ned og observeres og analyseres grundig ved å følge lenkene som er gitt på siden. Dette er en stor ressurs for journalister som ønsker å forstå informasjonen som kommer fra forskningsmiljøet.
204. JCB DataViewer
JCB DataViewer lar de som er interessert i hva Journal of Cell Biology har å si å se bildedataene knyttet til artiklene publisert der. Nettstedet har et fullstendig galleri som folk kan bla gjennom for å se materialene. I tillegg har seerne også muligheten til å kunne gjøre ytterligere analyse av dataene mens de ser på nettstedet. Enkelt sagt er dette nettstedet perfekt for å forstå referansene og figurene som finnes i tidsskriftets artikler.
205. Genomic Data Commons Dataportal
GDC Data Portal er en plattform som er designet for å hjelpe forskere og de innen bioinformasjonsfeltet til å utføre forskning på kreft mer effektivt. Det er et arkiv, en API, samt dokumenter tilgjengelig for lesing og så videre. Tilgang til dette nettstedet betyr å kunne se den samme informasjonen som kreftforskere bruker til å utføre sin egen forskning. Her vil journalister kunne finne all data de leter etter og litt til.
206. Opensp
Opensp er et fellesskapsdrevet prosjekt designet med det formål å dele genotyper. Personer som har blitt skrevet med FamilyTreeDNA, 23andMe eller deCODEme kan laste opp denne informasjonen til nettstedet. Hensikten med å be folk gjøre dette er slik at nettstedet kan fokusere på å se om det kan finnes sammenhenger mellom genotyper og SNP-er, eller enkeltnukleotidpolymorfismer. Det som er av unik interesse for journalister er at det er data tilgjengelig som folk kan laste ned og se gjennom.
207. Veileder
Pathguide er et nettsted som er dedikert til å gi informasjon om metabolske og signalveier samt interaksjoner mellom proteiner på molekylært nivå. Denne siden er vert for en liste med omtrent 697 ressurser relatert til hovedemnet. Databasene som er koblet til på denne siden er alle generelt gratis å få tilgang til. De fleste referansene på denne ressurslisten fokuserer først og fremst på interaksjon mellom protein og protein. Denne siden er en uvurderlig ressurs for biologientusiaster.
208. RCSB PBB
Dette er et nettsted som er dedikert til å informere akademikere og allmennheten om alt relatert til nukleinsyrer og proteiner. RCSB Protein Data Bank tilbyr tilgang til ulike verktøy designet for å gjøre dette aspektet av biologi mer forståelig, inkludert visualiseringsverktøy, 3D-strukturvisning og et fullt søkbart arkiv som kan kategoriseres etter organismekategori. I tillegg tilbyr denne siden oppdaterte nyheter om alle de siste utviklingene på dette feltet.
209. Psychiatric Genomics Consortium
Psychiatric Genomics Consortium er et resultat av samarbeid mellom etterforskere og forskere fra hele verden som jobber med forskning om den genetiske komponenten av psykiatriske lidelser. Til syvende og sist var dette prosjektet i stand til å produsere 17 hovedartikler og ytterligere 31 utviklingsartikler som tilbyr sekundær analyse og metode med et enkelt landemerkepapir som kom ut av det hele. Konsortiet tilbyr verktøy, nedlastinger og tilgang til funnene via datatilgangsportalen på forespørsel.
210. Pub Chem
PubChem er et respektert navn innen medisinsk og biologisk forskning og har vært det i svært lang tid. Ved å tilby muligheten til å søke i strukturer så vel som Compound, BioAssay og Substance databaser, kan forskere ikke gå galt med dette nettstedet. I tillegg er det millioner av oppføringer i hver av disse databasene. Denne informasjonen kan sees gjennom verktøy som 3D-konformeringsverktøyene og BioAssay-verktøyene. Dataene er også tilgjengelige for nedlasting.
211. KOSMISK
Som navnet antyder, er Catalogue of Somatic Mutations In Cancer, eller COSMIC, dedikert til kronikk og utforskning av effektene av somatiske mutasjoner i kreft. Siden gjør det mulig å søke i COSMIC kategorisert etter krefttype, gen og mutasjon. Det finnes verktøy på COSMIC som genomnettleseren og kreftnettleseren. I tillegg er det også data om genkurering, medikamentresistens, genomskjermer, mutasjonssignaturer og genfusjonskurering tilgjengelig på nettstedet for nedlasting.
212. Genomics of Drug Sensitivity in Cancer
Genomics of Drug Sensitivity in Cancer er dedikert til å finne biomarkører som kan hjelpe leger med å identifisere typen kreftmedisin som pasienter er mer sannsynlig å reagere på. Journalister kan bruke nyhetsfanene til å holde seg oppdatert på tilstedeværelsen av nye data eller endringer på nettstedet. I tillegg er det også en samling av data om cellelinjer, en database som beskriver funksjonene til kreft, og til og med en liste over forbindelser som alle er tilgjengelige for visning på nettstedet.
213. Stowers Institutt for medisinsk forskning
Stowers Institute for Medical Researchs nettsted tilbyr forskende medlemmer av offentligheten gratis tilgang til dataene som dets forskere, forskere og genomikkforskere har brukt for sine publikasjoner. For allmennheten gjør instituttet seg bryet med å påpeke at Stowers Original Data Repository vanligvis er gratis å få tilgang til. Når det er sagt, kan det hende at noen av de største filene i databasen ikke er tilgjengelige direkte via Internett og kan kreve ytterligere ordninger.
214. SSBD-database
Systemet Science of Biological Dynamics-databasen, vanligvis referert til som SSBD-databasen for kort, gir en rekke verktøy og ressurser som skal brukes for å undersøke mikroskopiske bilder og evaluere kvantitative biologiske data. Bildene funnet på dette nettstedet kom fra en rekke kilder og inkluderer objekter som celler, enkeltmolekyler og genuttrykkskjerner. Med dataene på dette nettstedet innhentet fra beregningssimulering og eksperimenter, kan journalister være trygge på at informasjonen her hele tiden foredles og oppdateres.
The Personal Genome Project er et nettsted som fokuserer på å lage helse-, genom- og egenskapsdata som er åpne og tilgjengelige for publikum. Dette nettstedet fortsetter i stor grad prosjektet med hjelp fra enkeltpersoner som har meldt seg frivillig til å offentliggjøre sin genomiske informasjon, og tilbyr dataene den har funnet og skaffet med hell gratis til publikum. Bortsett fra vitenskap, tilbyr dette prosjektet journalister et interessant blikk på effektene av å lage en offentlig oversikt over personlig genominformasjon.
216. UCSC Genome Browser
USCS Genome Browser lar enkeltpersoner se genomsammenstillinger. I tillegg til nettvisning, gir nettstedet også lenker som kan brukes til å laste ned sekvensene og merknadene for de samme genomsamlingene. Disse koblingene er delt inn i kategoriene mennesker, pattedyr, andre virveldyr, deuterostomer, insekter, nematoder, andre genomer og andre nedlastinger. Verktøyene og katalogene på dette nettstedet er også gratis for personlig og ikke-kommersiell bruk. Journalister kan dra nytte av grundigheten og tilgjengeligheten til denne informasjonen.
217. UniProt
Universal Protein Resource, kjent under navnet UniProt, er stedet å gå for informasjon om proteinsekvensering og merknader. Med utgangspunkt i informasjonen fra tre databaser i UniProt Reference Clusters, UniProt Knowledgebase og UniProt Archive, er dette nettstedet utstyrt med blant annet peptid- og klyngesøk. Journalister kan bruke dette nettstedet til å verifisere, oppdage og lære mer om nye oppdagelser innen proteinsekvensering og merknader.
Actuaries Climate Index, også kalt ACI for korte, gir allmennheten og beslutningstakere informasjon om klimatrender og effekten av klimaendringer i Canada og USA. Forskere kan lese informasjonen fra dette pedagogiske verktøyet for å finne og oppdage enorme endringer i hav og vær. Det er mulig å begrense søket etter regioner og komponenter. Dette nettstedet har tiår med data til rådighet, og det oppdaterer rutinemessig informasjon kvartalsvis.
219. Luftfartsværsenter
Aviation Weather Center gir nøyaktig, tidsriktig og oppdatert informasjon om været som luftromssystemet kan stole på. På dette nettstedet kan brukere se de forskjellige grafene, prognosene og observasjonene av været innrammet på en måte som flyvere kan sette pris på. Det er mulig å se informasjonen fra nettstedets datakilder i sanntid gjennom enten .csv- eller XML-utdata. Forskere kan manipulere og observere de rå tallene nærmere gjennom dette nedlastingsalternativet.
Klimaforskningsenhetens nettsted er der for det uttrykkelige formålet å forske på effektene av klimaendringer i fortiden, studere årsakene og finne løsninger på klimaendringer i nåtiden. Her kan folk lese seg opp om resultatene av forskningen, få oversikt over emnet gjennom informasjonsarkene, lese publikasjoner og til og med få tilgang til rådataene. Journalister på jakt etter råværdatasett er heldige med denne ressursen.
221. Europeisk klimavurdering og datasett
På nettstedet til European Climate Assessment & Dataset kan publikum oppdage informasjon om ekstreme endringer i enten klimaet eller været. Forskere har muligheten til å bruke prosjektets forskningsverktøy, kalt KNMI Climate Explorer, til å verifisere data, undersøke sesongprognoser og til og med se nærmere på effektene av El Nino blant andre applikasjoner. Siden dette datasettet oppdateres daglig, vil journalister som bruker denne kilden være de første som får vite om tegn på ekstreme klimaendringer.
222. Global Imagery Browse Services
Global Imagery Browse Services, forkortet GIBS, er en viktig del av EOSDIS i sin rolle som leverandør av bildetjenester som er responsive og basert på fellesskapsstandarder. Sagt på en annen måte lar GIBS vanlige mennesker samhandle med satellittbilder tatt fra praktisk talt hvor som helst på jorden i høyoppløsning. Siden EOSDIS GIBS er gjort tilgjengelig gjennom NASAs geovitenskapelige data, er det enklere enn noen gang for journalister og forskere å lære mer om verden i sanntid.
223. Bering klima og økosystem
Denne nettsiden, som opererer under USAs regjerings nasjonale oseaniske og atmosfæriske administrasjon, forteller journalister og forskere alt de måtte ønske å vite om hvordan Beringhavets klima og økosystem reagerer på endringene som har skjedd i Arktis. Her er det mulig å lese essays, gjennomgå anslag og bruke det elektroniske dataverktøyet for å se hvordan ulike klimaindekser, biologiske, atmosfæriske, havdata og dyreliv har det i Beringhavet.
224. NCEI
NCEI, eller National Centers for Environmental Information, er det endelige resultatet etter sammenslåingen av National Oceanic and Atmospheric Administration sine tre datasentre. Denne siden er vert for en serie lenker delt inn i 22 kategorier som vil knytte brukere til forskjellige ressurser, sider av interesse og klima- og værdatasett. Journalister på jakt etter informasjon om klima, stormer, nedbør og en rekke andre værproblemer, vil sannsynligvis finne det de leter etter her.
225. Earth System Research Laboratory
National Oceanic and Atmospheric Administrations globale overvåkingsavdeling gir informasjon om de langsiktige trendene for kreftene til klimaendringer på jorden gjennom sin overvåking av viktige atmosfæriske beregninger. Blant disse vil være karbonmonoksid, metan, lystgass og karbondioksid for eksempel. Disse beregningene brukes deretter til å måle ting som langsiktig ozonnedbrytning, karbondioksidkilder og -nivåer, samt synker. Dette er en klimaressurs som journalister kan bruke.
226. WorldClim – Globale klimadata
Har du noen gang ønsket en bedre måte å vise klimadata på? WorldClim er en programvareleverandør av gratis data som deretter kan brukes til romlig modellering så vel som for å lage kart. Den nåværende versjonen av denne gratis programvaren kan bare brukes på det nåværende klimaet, mens den gamle versjonen gir tilgang til klimadata fra fortiden og nåtiden og lar brukere også se tilstanden til fremtidige klimaspådommer. Journalister kan bare følge lenken og laste ned programvaren.
227. Knowledge Discovery Laboratory
The Knowledge Discovery Laboratory er et nettsted som er dedikert til utvikling av innovative teknologier, det grunnleggende innen maskinlæring og anvendelse av denne kunnskapen på praktiske områder som nettverksvitenskap, svindeloppdaging og analyse av vitenskapelige data. Nettstedet er vert for et ganske betydelig datasett i DBLP med 1,2 millioner objekter og 2,48 millioner lenker inkludert i settet. For forskere med interesse for Knowledge Discovery Laboratory sine mål, er dette datasettet en utmerket ressurs.
228. DIMACS Implementeringsutfordring
Nettstedet til 9th Implementation Challenge handler om å hjelpe forskere med å lære å løse korteste veiproblemer. For skaperne ble nettstedet bygget med to mål i tankene. Først for å finne de beste reproduserbare løsningene. Og to, for å gjøre det enkelt for forskere å samarbeide og finne mer effektive løsninger. Forskere som er interessert i å se hvor mye fremskritt som er gjort med dette, kan gå gjennom papirene og datasettene på nettstedet.
229. Nettverkslager
Network Repository er et nettsted hvor vitenskapelige data lagres med tillegg av interaktive visuelle verktøy som brukere kan få tilgang til og analysere. Dette nettstedet har den doble utmerkelsen av å være både det første depotet i sitt slag og også det største på nettet. Å bruke grafiske data og intuitive, visuelt engasjerende bilder, gjøre sammenligninger og finne nye måter å kontekstualisere data på er mye enklere. Journalister kan bruke denne kilden til å finne historier innenfor de vitenskapelige dataene.
230. Pajek datasett
Pajek Datasets er en side som gir et datasett som tar for seg interaksjonene mellom proteiner som finnes i spirende gjær. Etter å ha tilbudt en kort bakgrunnsforklaring på virkningen av å finne nye metoder for å oppdage interaksjoner sammen med årsakene til at det å kunne skjelne viktigheten av ulike protein-til-protein-interaksjoner er avgjørende, kobler nettstedet seere direkte til et datasett som er tilgjengelig for nedlasting. For å lære mer kan forskerne klikke på lenken nederst for å lese artikkelen som er publisert om emnet.
231. Mejn nettverksdata
Denne siden søker å dele lenker til nettverksdatasettene som netteieren har brukt og kompilert. Temaene for datasettene spenner fra American College-fotball, politiske blogger og bøker om amerikansk politikk, til sosiale nettverk, Les Miserables og høyenergiteorisamarbeid. Personer med interesse for å utforske disse vil ha mange interessedatasetttemaer å velge mellom. I tillegg er dataene gratis å bruke så lenge det finnes referanser.
232. Stanford GraphBase
Stanford GraphBase er navnet som er gitt til en haug med datasett og programmer av Stanfords Donald Knuth. Når de brukes i kombinasjon med hverandre, er disse programmene og datasettene i stand til å manipulere og generere grafer og nettverk. På denne siden er det nødvendige materialet tilgjengelig for nedlasting via lenkene. I disse filene vil forskere finne fotballresultatdata, ordbokdata, data som gjelder rekonstruksjonen av Mona Lisa og mange andre.
233. SuiteSparse Matrix Collection
Tidligere kjent som University of Florida Sparse Matrix Collection, SuiteSparse Matrix Collection er en samling matriser som har implikasjoner i det virkelige liv. I følge nettstedet brukes denne spesielle samlingen oftere enn ikke for numerisk lineær algebra for å utvikle og raffinere sparsomme matrisealgoritmer. Brukere har en tendens til å like samlingen for dens nytte ved å kjøre og teste resultatene av eksperimenter. Datasettene og matrisebenchmarks er tilgjengelige for nedlasting direkte på nettstedet.
234. Grafdatasett
Dette er et sett med datasett som skaperne av denne nettsiden mente å være enten relasjonelle eller i stand til å oversette godt til grafrepresentasjon. Graph Datasets tilbyr datasett som Predictive Toxicology Challenge-data, IMDb-data, mutagenesedata, MovieLens-data, samarbeidsfiltrering og proteindata til forskere som ønsker å lære å jobbe med de rå tallene. Filene gjøres tilgjengelig på denne siden og er primært tilgjengelig for nedlasting i XML-format.
235. Big Data Nyheter
Big Data News er et nettsted som er fokusert på big data og det grunnleggende innen datavitenskap. Denne siden er hjemmet til de siste nyhetene og inkluderer diskusjoner om dyp læring og kunstig intelligens. I tillegg er Big Data News også hjemsted for et massivt datasett som inneholder totalt cirka 3,5 milliarder nettsider. Disse er alle atskilt av nivåer som refereres til som henholdsvis sidenivågraf, underdomenenivågraf, førstenivåunderdomenegraf og lønnsnivådomenegraf.
236. Senter for komplekse nettverk og systemforskning
CNetS, eller Center for Complex Networks and Systems Research, som opererer under paraplyen til Indiana University Network Science Institute og School of Informatics and Computing. Nettstedet er ment å være en ressurs innen datavitenskap, beregningsbasert samfunnsvitenskap og komplekse nettverk og systemer med informasjon om gruvedrift og trafikkmønstre på nettet. I tillegg er CNetS også vert for et datasett som inneholder omtrent 53,5 milliarder nettverksforespørsler fra Indiana University-brukere.
237. OONI Explorer
OONI Explorer, en del av Open Observatory of Network Interference, er et prosjekt dedikert til å tilby gratis programvare med åpen kildekode. Det er mulig for brukere å bruke programvaren til å prøve å blokkere nettsteder og meldingsapper blant andre applikasjoner. Av spesiell interesse for folk som er interessert i denne teknologien, er tilgjengeligheten av gratis tilgang til rådataene som OONI har samlet inn. Bare skriv inn informasjonen i OONI Explorer og samhandle med dataene derfra.
238. Utfordringer i maskinlæring
Utfordringer i maskinlæring er dedikert til forskning og utvikling av maskinlæring. På dette nettstedet vil leserne finne lenker til programvare, bøker, maskinlæringsutfordringer, samt varsler om kommende workshops. Nettstedet gir til og med lenker til utfordringer som tillater innsendinger etter dato. For journalister som er interessert i å se om maskinlæring kan utføre oppgaver som økonomisk prediksjon eller nettsideklassifisering, er dette et nettsted som er vel verdt et besøk.
239. DataX
DataX jobber for tiden under paraplyen til CrowdANALYTIX, og er maskindelen av et fellesskapsdrevet initiativ som utnytter kraften til kollektivet for å lage tilpassede applikasjoner for kunstig intelligens, maskinlæring og nevro-lingvistisk programmering. Rollen til DataX i prosessen er vedlikehold og distribusjon som igjen tjener til å gjøre disse løsningene skalerbare. For journalister som har tonnevis av tekst, video og data å sortere gjennom, kan robotene som er tilgjengelige gjennom CrowdANALYTIX og DataX halvere forskningstiden.
240. Drevet data
Driven Data kombinerer crowddsourcing med datavitenskap på en måte som nesten ingen andre nettsteder gjør. Dette nettstedet understreker sin rolle i å gi bistand til organisasjoner som takler ulike sosiale utfordringer, og tilbyr hjelp ved å sette sitt betydelige datavitenskapelige fellesskap i arbeid med å lage statistiske modeller som løser prediktive spørsmål. Driven Data ser ut til å fungere primært med ideelle organisasjoner, men det er potensielt nyttig for alle som har rådata som trenger å foredles. Journalister kan ha nytte av å ha denne kilden i tankene.
241. Åpne Big Data
Dandelion API er en applikasjon som håndterer semantisk tekstanalyse for big data. Hva dette betyr for folk som har data som krever behandling er at dette programmet vil ta uorganisert tekst og finne en måte å sette den i sammenheng. Journalister som analyserer mange dokumenter kan definitivt dra nytte av den muligheten. Dandelion API har også Open Big Data under kategoriene Milano, Trento og Europa. Selv om denne API-en er betalt, er det en daglig mengde tekst som kan analyseres gratis.
242. Jordmodeller
Earth Models fokuserer på å dele og lagre programvare og datasett ettersom de er relatert til jorden. Modelleringsverktøyene som er nevnt på nettstedet inkluderer simuleringsprogramvare og prosessering samt virtuelle data som låner mye fra spesifikke studieområder som tektonikk og seismologi. Journalister og forskere som ønsker å foredle kunnskapen sin om emnet, kan bruke publikasjonene og artiklene på dette nettstedet til å gjøre det før de dykker inn med modellerings- og visualiseringsverktøyene.
243. Sosioøkonomisk data- og applikasjonssenter (SEDAC)
Socioeconomic Data and Applications Center, eller SEDAC, er et av datasentrene knyttet til NASAs EOSDIS-system. På dette nettstedet vil leserne finne datasett som gir tall om klimaendringer eller rutenettet demografisk informasjon. Datasettene kan også søkes etter temaer som styresett, landbruk, arealbruk, helse, bevaring og klima, vann, fjernmåling og fattigdom. Det er kart, gallerier, guider som gir mer kontekst til dataene, og tilleggsressurser og verktøy som forskere også kan få tilgang til på nettstedet.
244. AODN-portalen
AODN Portal, et nettsted som holdes av Australian Ocean Data Network, er et nettsted som tilbyr tilgang til australsk klimavitenskap og marine data. Forskere som får tilgang til denne informasjonen vil også ha tilgang til IMOS-dataene og metadataene, som er et forskningsrammeverk av flere institusjoner, inkludert støtte fra den australske regjeringen. Forskere som velger å utnytte AODN-portalen kan forvente å motta utmerket levering av havdata i et intuitivt grensesnitt.
245. Planet OS
Planet OS tilbyr et rammeverk for store data med vekt på fornybar energi. Dette valget av nisje kombinert med nettstedets dyktighet har gjort det populært blant energiselskaper på jakt etter nye måter å visualisere og kontekstualisere dataene deres. I tillegg har nettstedet også det som kalles DataHub til stede, hvor det er vert for en betydelig samling av over 2000 datasett. Disse datasettene inkluderer åpne data gjennom NASA og Copernicus, og dataene oppdateres ofte med jevne mellomrom.
Smithsonian har lenge vært et respektert akademisk navn og er verdsatt over hele verden for sitt engasjement for forskning og historie. På noen måter er det bare naturlig at Smithsonian har et nettsted som tilbyr noe av den beste informasjonen om vulkanforskning på nettet. Nettstedet publiserer rapporter, forskningslenker og databaser som inkluderer innsnevret vulkan, utbrudd, utslipp og deformasjonssøk for å passe med Holocene-vulkanlisten og regnearket. Journalister trenger ikke en annen kilde om vulkansk aktivitet.
247. Jordskjelvkatalog
Oppdatert og vedlikeholdt av den amerikanske regjeringens Earthquake Hazards Program, lar Earthquake Catalog forskere se når og hvor et jordskjelv sist har skjedd. Mens søkeresultater er begrenset til 20 000, er katalogsøk i stand til å filtrere resultater etter størrelse, dato og klokkeslett, og til og med etter geografisk region. Dette fleksibilitetsnivået gjør denne ressursen spesielt nyttig for journalister som dekker en naturkatastrofe eller et lokalt jordskjelv og leter etter litt bakgrunnsinformasjon.
248. American Economic Association
American Economic Association gir forskere data om makroøkonomiske data for USA og andre land rundt om i verden. Dette nettstedet ser ikke ut til å produsere økonomiske data så mye som det samler en kort liste over de mest pålitelige. Men i lys av de mange nettstedene som tilbyr økonomisk informasjon på Internett, er dette en ressurs som journalister kan forvente å ha troverdighet. Bare gå til nettstedet og klikk gjennom kategoriene med økonomiske data tilsvarende.
Historicalstatistics.org er et utrolig nyttig nettsted for å finne den typen økonomisk informasjon som utgjør en interessant kontrast til nåtiden. For eksempel lar nettstedets historiske valutaomregner forskere finne ut hvor mye en person med $10 USD i 1923 kunne kjøpe i dag. Det er også vert for publikasjoner og artikler som stiller spørsmål om beregningene som brukes innen økonomisk historie sammen med prisindekser og informasjon om pengemengde som kan filtreres etter land.
250. DB Nomics
Hva om alle offentlige økonomiske data på Internett kunne nås og søkes fra én enkelt, navigerbar plattform? Db.nomics er en økonomisk databaseaggregator som søker å gjøre akkurat det. Dataene er tilgjengelige i formater som HTML, JSON og CSV og oppdateres automatisk mens tidligere revisjoner arkiveres deretter. Økonomiske kilder inkluderer Federal Reserve, Bureau of Economic Analysis, Det internasjonale pengefondet og andre. Forskere som leter etter anerkjente økonomiske data kan ikke gå galt med Db.nomics.
251. Joint External Debt Hub (JEDH)
Utviklet gjennom det kombinerte arbeidet til Bank for International Settlements, Organisasjonen for økonomisk samarbeid og utvikling (OECD), Det internasjonale pengefondet og Verdensbanken, gjør Joint External Debt Hub informasjon om gjeldsdata og internasjonale kreditorer og debitorer tilgjengelig for offentligheten. Journalister som ser på økonomien til forskjellige nasjoner og prøver å få en dypere forståelse av det internasjonale finanslandskapet, vil finne praktisk talt alt de ønsker å vite her.
252. Internasjonal handelsdata
Sett sammen med hele innspillet fra en ledende økonomisk ekspert i Jon Haveman, er denne siden om International Trade Data vert for data som kan lastes ned og analyseres videre. Datasettene inkluderer tariffdata, Penn World-tabeller, verktøy, importdata, produksjonsproduktivitet, vareklassifiseringer, Rauch Product Differentiation Codes, NBER-data, 1997-vareflytundersøkelsen, handel og immigrasjon, og den nyttige gravitasjonsmodellen. UNIX er operativsystemet som brukes til å kompilere disse, men siden bemerker at PC-er også bør ha tilgang til dataene.
253. Åpne bedrifter
På OpenCorporates har forskere luksusen av å søke og finne informasjon en av de største åpne databasene for selskaper rundt om i verden. Denne informasjonen blir deretter brukt av forskjellige grupper rundt om i verden som banker, etterforskere, frivillige organisasjoner og journalister i et forsøk på etterretning og informasjon. Journalister har den ekstra fordelen av å kunne få tilgang til dataene i sanntid ved hjelp av OpenCorproates API så vel som gjennom bulk kjernedata eller andre kjernedatasett.
254. Vår verden i data
Our World in Data henter informasjon fra en rekke kilder på en rekke områder og presenterer kvantifiserte data om den. Fra tall om kvinners deltakelse i arbeidsstyrken til informasjon om generell korrupsjonsoppfatning i offentlig sektor og global inntektsulikhet, hvis emnet kan diskuteres i form av data, kan dette nettstedet bare ha en oppføring for det. Journalister kan bruke denne kilden til å finne statistikk og tall når det gjelder sosiale spørsmål.
255. Science Po
Sciences Po, eller som det er kjent mer vanlig, Institute of Political Studies er en skole som har ubestridelig innflytelse innen samfunnsvitenskap. I dette tilfellet inkluderer Thierry Mayers side datafiler som inneholder tyngdekrafts- og militære konfliktregresjonsdata fra "Make Trade Not War" så vel som datasett om markedspotensialer blant flere andre. Journalister som ønsker å bedre forstå konklusjonene i akademiske tidsskrifter, vil avdekke mye informasjon mens de surfer på dette nettstedet.
256. Senter for internasjonale data
Helt siden debuten i 1999, har Senter for internasjonale data vært dedikert til sitt oppdrag med å samle inn, skape, forbedre og distribuere internasjonale økonomiske data både offline og online. På nettsiden får leserne tilgang til informasjon som amerikanske tariffdata, import og eksport fra verden og USA, og til og med informasjon fra Penn World Table. Når denne informasjonen gjøres tilgjengelig for allmennheten for utdanning og forskning, kan journalister få tilgang til og bruke disse dataene gratis.
257. Observatoriet for økonomisk kompleksitet
Observatory of Economic Complexity, ofte referert til som OEC, lar forskere, studenter, økonomer og alle andre visualisere internasjonale handelsdata. Med sine iøynefallende temaer og interaktive grensesnitt gir dette nettstedet forskerne en legitim mulighet til å utforske internasjonal handelsinformasjon på måter som aldri har vært sett før. For journalister som liker å kunne se økonomiske data komme til live mens de søker etter dem, er OEC en uvurderlig ressurs.
258. Colleges resultatkortdata
Høyere utdanning er et populært tema i mange kretser med både studenter og familier som ønsker å vite hvordan skolene står seg og hvor godt elevene lærer. Gjennom sine College Scorecard-data gir det amerikanske utdanningsdepartementet lærere og studenter all denne informasjonen og mer. Disse tallene dekker 1996 til 2016 og inkluderer nåværende data, målkortdata og inntekter etter skoletid, og ny informasjon om National Student Loan Data System. Det er en kilde til oppdatert post-videregående utdanning som journalister bør være sikre på å bruke.
259. Energidatasett for næringsbygg
Som et datasett som primært omhandler energi, har COMBED et automatisk krav på unikhet. Legg inn det faktum at dataene fornyes flere ganger i minuttet mens de kommer fra et næringsbygg, og det blir klart at dette datasettet er unikt. For journalister er denne informasjonen utrolig nyttig å ha når de skal utarbeide et stykke om energiforbruk. Å få tilgang til COMBEDs data er like enkelt som å laste ned og åpne et Excel-regneark.
260. DRED Datasett
DRED-delen av DRED Database står for Dutch Residential Energy Dataset. Som tittelen antyder, måler og studerer disse dataene hvor mye energi en enkelt nederlandsk husholdning vil forbruke. Atmosfære, belegg, elektrisitet og generell husholdningsinformasjon ble overvåket i dette datasettet fra 5. juli 2015 til 5. desember 2015. Alle journalister som undersøker energiforbruk vil ha nytte av å sjekke ut de rå tallene som er oppgitt her. Instruksjoner for nedlasting av dataene i CSV finner du direkte på nettsiden.
261. ECO-datasett
ECO, som står for Electricity Consumption and Occupancy, er et prosjekt som drives og drives av Distributed Systems Group. Forutsetningen for dette prosjektet var at forskere overvåket belastningene og oppdaget beboelse i seks sveitsiske husstander i løpet av 8 måneder. Dette nettstedet tilbyr tilgang til denne informasjonen samt instruksjoner og lenker til relaterte publikasjoner. Takket være nettstedets visuelt interaktive dashbord, skal journalister ikke ha problemer med å oversette forskningen til noe engasjerende.
262. Indisk datasett for omgivende vann og energi
IAWE, som står for Indian Dataset for Ambient Water and Energy, ble opprettet med mål om å overvåke energibruken til et New Dehli-hjem med strømmålinger fra apparater, strømmåleren og kretspanelet. På grunn av strømbrudd, forskjeller i vannforsyning, pakkefall og spenningssvingninger, fikk iAWE problemer som var unike for sporing av energibruk i India. Dette er utrolig nyttige data for journalister å ha når de diskuterer energibruksmønstre.
263. Elektrisitet på nivå med husholdningsapparater i Storbritannia
UK Domestic Appliance-Level Electricity, eller UK-DALE, er navnet gitt til et datasett som overvåker og registrerer hvor mye strøm som kreves i en gruppe på fem husstander. Hvert sjette sekund måler UK-DALE etterspørselen fra både hovedstrømnettet og de enkelte apparatene i huset. Journalister med interesse for å se hvordan britiske husholdninger bruker energi, kan definitivt ha bruk for UK-DALE. Dataene er tilgjengelige og det er en artikkel som beskriver systemet tilgjengelig for lesing.
264. ArcGIS
ArcGIS Hub er en plattform som organisasjoner og enkeltpersoner kan bruke for å oppnå mål gjennom initiativer som omfatter hele nettstedet. Med sidemaler, trinnvise veiledninger og eksempler tilgjengelig for visning, er dette nettstedet en utmerket ressurs for ambisiøse sosiale flyttere. I mellomtiden er informasjonen som er tilgjengelig under fanen Åpne data vert for hundrevis av datasett i kategorien "Katastrofe". Enten journalister undersøker data eller bidrar med dem, er ArcGIS Hub nyttig på mer enn én måte.
265. Cambridge GIS
Cambridge GIS er byen Cambridge, Massachusetts sitt åpne datalager. Med unntak av filene som er for store til å lastes ned gjennom dette GitHub-lageret, kan de fleste av byens datasett finnes på denne siden. De individuelle datasettene som er tilgjengelige her inkluderer kommersielle distrikter, servitutter, sonedistrikter, folketellingsresultater, kirkegårder og andre landemerker og funksjoner som kan kvantifiseres med data. En journalist som graver etter lokal informasjon vil finne alt de leter etter og mer på denne siden.
266. Geo-Wiki.org
Som en ressurs er Geo-Wiki et nettsted som er dedikert til det den kaller "borgervitenskapsbevegelsen". Her oppfordres innbyggerne til å prøve seg på miljøovervåking. Forskere kan finne de siste nyhetene i sidefeltet sammen med navnene på publikasjonene og gratis datasett og programvarenedlastinger. Verktøyene som nettstedet gjør tilgjengelig inkluderer kart, personlige dataopplastinger, valideringer og hackathons som kan lastes ned i Excel-format og zip-filer.
267. OpenStreetMap
OpenStreetMap-dataekstraktene kommer fra OpenStreetMap-prosjektet, det pågående online forsøket på å lage et kart over verden gjennom redigeringer og innsats fra det globale brukerfellesskapet. For å komme i gang med denne datakilden, er alt innholdsutgivere trenger å gjøre å velge sitt foretrukne kontinent og deretter finne sitt foretrukne land etter det punktet. Det er ingen gebyrer for å laste ned denne Geofabrik GmbH og dataene oppdateres daglig som hovedregel.
268. HIFLD åpne data
Operert og vedlikeholdt av Department of Homeland Security, HIFLD, for Homeland Infrastructure Foundation-Level Data, plasserer geospatiale data i det offentlige domene. Disse dataene distribueres med det uttrykkelige formålet å gi støtte og informasjon for formål med forskning og forberedelse i samfunnet. Disse dataene kan lastes ned til Shapefile og CSV, og de kan også sees på nettet. For utgivere gjør HIFLD Open Data geospatiale data mer visuelle og engasjerende enn noen gang.
269. Åpne adresser
OpenAddresses spesialiserer seg på adresseinfrastruktur og innsamling. Dette nettstedet er hovedsakelig drevet av fellesskapets innsats, og bruker GitHub som sin utviklingsplattform. Her kan folk plassere adresser på et kart etter å ha lagt det til i databasen, eller de kan ta dataene og begynne geokoding direkte med en gang. Med alle dataene og adressene åpne og bare krever attribusjon, gjør de vanlige dataoppdateringene og potensialet for geokoding fremskritt OpenAddresses til et veldig interessant prosjekt.
270. Åpne data LMU
Open Data LMU er avhengig av data fra OpenStreetMap for å hjelpe til med utviklingen av Fast Reverse Geocoder. Hva dette betyr er at applikasjonen er i stand til raskt å ta en plassering på et kart og finne en fullstendig adresse basert på det punktet. Dette kan potensielt også brukes til nabolag og fylker. Denne nettsiden er vert for en haug med lenker relatert til applikasjonen som inkluderer kildekode, datasett og OpenStreetMap-oppslagstabeller og oppløsninger.
271. Environmental Data Explorer
Med Environmental Data Explorer kan journalister, forskere og studenter laste ned og utforske de samme datasettene som FNs miljøprogram bruker sammen med sine tilknyttede organisasjoner og partnere. Søk kan begrenses etter region og gjøres ved å bruke et eller flere av 500 filtre. I tillegg inkluderer datasettene kategorier som helse, BNP, klima, utslipp og ferskvann som kan sees direkte på nettstedet enten i graf-, tabell- eller kartform.
272. African Development Bank Group
Den afrikanske utviklingsbankgruppens nettsted er journalistens første stopp når de leter etter statistisk informasjon og indikatorer som er relatert til det afrikanske kontinentet. Brukere som ruller gjennom datakatalogen kan filtrere datasett etter kilde, emne og region. For alle som leter etter dypere kunnskap om emnet, tilbyr nettstedet også lenker til en imponerende liste over publikasjoner som inkluderer titler som African Economic Outlook og African Statistical Yearbook.
273. Genomic Data Commons (GDC)
NCIs Genomic Data Commons er hjemmet til et av de mest grundige kreftdataarkivene på nettet som fokuserer på området kreftgenomiske studier. Dette nettstedets dataportal er vert for tusenvis av tilfeller og dekker 38 typer sykdommer for 39 prosjekter og er gratis å få tilgang til. Med datainnsendinger primært utført av institusjoner og forskere, gjør nøyaktigheten til denne informasjonen den til en datakilde som er ideell for journalister å ha i baklommen.
274. PhysioBank Databaser
PhysioBank-databasene gjør fysiologiske data tilgjengelig for enkeltpersoner via det offentlige domene. Disse databasene er delt inn i to større kategorier i bølgeform og klinisk. Blant bølgeformunderkategoriene er det bilde-, interslagintervalldatabaser, syntetiske, gang- og balansedatabaser, EKG og multiparameterdatabaser. En smak av den rene informasjonen som kommer ut av dette inkluderer data om vitale tegndata ved sengen, oksygenmetning og til og med hjerte- og karsykdommer. Journalister og enkeltpersoner som forsker på menneskekroppen kan finne informasjon her.
275. Medicare Coverage Database
Medicare Coverage-databasen, vedlikeholdt av Centers for Medicare & Medicaid Services gjennom Department of Health and Human Services, gir forskere full tilgang til massevis av informasjon om medisinske tjenester. Det er informasjon om kroniske lidelser, medikamentforbruk, elektroniske kliniske maler, inkassosystemet og forsknings- og demonstrasjonsstipend for å lese om det. For data hentet direkte fra kilden, er dette det mest grundige og omfattende nettstedet i sitt slag online.
Innhold fra våre partnere
276. Åpne betalingsdata
Når de fleste går til legen, setter de seg vanligvis ikke ned for å tenke på om deres primærlege har økonomisk fordel eller ikke etter å ha jobbet med produsenter av helsevesenet. Open Payments informerer publikum om måltider, forskning, gaver, talehonorarer og reiseutgifter som legen eller sykehuset har mottatt fra bedrifter. Journalister på jakt etter en hardtslående historie kan enten bruke datautforskeren for å se informasjonen eller klikke på fanen for å laste ned dataene direkte.
277. Flickr-logoer
Det er delvis skrevet i navnet, men FlickrLogos refererer til et datasett som består av firmalogoer som har blitt fotografert i en rekke forskjellige posisjoner. Denne samlingen ble vedlikeholdt av Augsburg Universitys Multimedia Computing and Computer Vision Lab, og ble opprinnelig kompilert med den hensikt å trene datamaskiner til å gjenkjenne logo og tekst. For å holde deg oppdatert på fremskritt med dette nyhetsverdige programmet, kan det ikke skade å laste ned dette datasettet og se hva det handler om.
278. ImageNet
ImageNet er en database full av bilder som er organisert av WordNet. Det er årlige utfordringer på siden som kan sees selv etter stenging og er fokusert på å lage algoritmer som er i stand til å utføre spesifiserte oppgaver. ImageNet er også hjemsted for en rekke publikasjoner, siteringer og lysbilder. Teknologiske innholdsutgivere ville ha all grunn til å bruke utforskeralternativet for å forstå WordNet-strukturen så vel som skykartet.
Stanford Dogs-datasettet inneholder tonnevis av bilder og bilder av forskjellige hunderaser. Med 120 forskjellige raser av hunder inkludert sammen med over 20 000 individuelle bilder, gir denne ImageNet-drevne databasen forskere mange bilder å jobbe med mens de lærer maskiner hvordan de skal gjenkjenne hver hunderase. På nettstedet kan lenker til ulike publikasjoner som diskuterer bruken av datasett for å lære datamaskiner om bildegjenkjenning klikkes på og leses sammen med datasettnedlastingen.
280. SUN Database
SUN-databasen er stedet for et prosjekt satt sammen for forskningsmiljøet for å gjøre fremskritt innen områder som datasyn og grafikk, datautvinning, maskinlæring og nevrovitenskap blant andre. Med over 131 000 bilder og nesten 4000 kategorier av objekter i indeksene, er dette nettstedet så omfattende som det kan bli. For utgivere som er interessert i denne databasen og hva forskere har vært i stand til å gjøre mens de har brukt den, er dette en datakilde som er verdt å utforske.
281. Oxford-IIIT kjæledyrdatasett
Oxford-IIIT Pet Dataset er et nettsted som fungerer som et supplement til en artikkel som ble publisert på 2012 IEEE Conference on Computer Vision and Pattern Recognition og er vert for det originale datasettet som ble brukt til oppgavens formål. Disse bildene er organisert i omtrent 37 kjæledyrkategorier for å passe med ytterligere 200 bilder knyttet til hver klasse involvert. Videre kan disse dataene lastes ned direkte via lenkene på nettsiden.
282. Det visuelle genomdatasettet
Visual Genome API er sluttresultatet av det harde arbeidet gjort av flere studenter og førsteamanuensis fra Stanford University. Med flere papirer til navnet sitt i søken etter å lage et API som er i stand til å evaluere og beskrive bilder, har programmet besvart over en million spørsmål mens det har vurdert over 100 000 bilder. Denne API-en representerer fremgang innen datavitenskap og dets relaterte felt, og datasettet kan lastes ned direkte på nettstedet.
283. YouTube-ansikter
YouTubes ansiktsdatabase fokuserer på å utvikle en løsning på problemet med automatisk ansiktsgjenkjenning i videoer. Til sammen har datasettet over 3000 videoer hentet fra YouTube av nesten 1600 individer med en gjennomsnittlig lengde på omtrent 181 bilder. Til syvende og sist er målet å lage en algoritme som er i stand til å lage etiketter som identifiserer personen som er med i videoen. Dataene sammen med informasjon om feil samt beskrivelsesmetodene er alle tilgjengelige for visning direkte på nettstedet.
284. KEEL-datasettlager
KEEL-datasettet inneholder datasettet med Java-basert åpen kildekode-programvare som er utviklet for å hjelpe til med ulike typer kunnskapsdataoppdagelse. KEEL, kjent ganske enkelt som Knowledge Extraction based on Evolutionary Learning, kan trenes til å lære å legge til manglende verdier, hybridmodeller og statistiske metoder for å evaluere eksperimenter blant en rekke andre oppgaver. Datasettnedlastingene samt en fullstendig liste over algoritmene i KEEL kan lastes ned direkte fra nettstedet.
285. Utlånsklubb
Lending Clubs krav på berømmelse er dens status som en peer-to-peer-utlåner som lar låntakere motta lån selv når de ikke nødvendigvis har kredittscore til å låne fra tradisjonelle långivere. Sammen med de nye aspektene ved hvordan nettstedet fungerer, gir det også statistikk som inkluderer plattformhøydepunkter, informasjon om avvist lån, tall for investorresultater og til og med en dataordbok som inneholder historiske data. Disse tallene starter vanligvis fra 2007 og kan lastes ned i CSV.
Naturhistorisk museum anses av mange for å være et av de mest gjenkjennelige museene i verden, men digitaliseringen og muligheten til å undersøke katalogen gjennom den åpne dataportalen vil sannsynligvis være en nyhet for mange mennesker. Med 91 datasett som inkluderer mikrofossil- og fossilsamlinger samt indekspartiposter blant annet materiale, er dataene åpne for publikum og gratis å laste ned i flere formater.
287. Getty-vokabularene
Dette nettstedet er perfekt for journalister og utgivere som ønsker å holde seg innenfor visse stilretningslinjer når de beskriver og kategoriserer bestemt kunst, kunstnernavn, arkitektur, materialer og geografiske navn. Dette nettstedet kobler brukere direkte til de kontrollerte vokabulardatabasene som forskere og katalogiserere trenger å vite om for å møte internasjonale standarder. Her er det i hvert fall ingen som slår Getty Vocabularies. Datasettene kan utforskes gjennom tekst eller SPARQL og kan lastes ned via nettstedet.
288. CLiPS Stylometry Investigation (CSI) Corpus
CLiPS Stylometry Investigation Corpus er sannsynligvis ikke det folk flest tenker på når de hører ordene CSI, men CSI-korpuset er likevel et datasett som består av studentanmeldelser og studentessays. I tillegg til selve teksten, er tilstedeværelsen av metadata og informasjon innebygd i dokumentet registrert av nettstedet for å ha flere bruksområder. Tilbys og distribueres under Creative Commons-lisensen, alt som korpuset ber om i bytte for å bruke datasettet er en attribusjon.
289. Universelle avhengigheter v2
Universal Dependencies v2 refererer til den andre oppdaterte versjonen av Universal Dependencies-prosjektet, et forsøk på å utvikle en trebankkommentar som kan brukes konsekvent med flere forskjellige språk. I den oppdaterte versjonen vil forskere finne dusinvis av UD-trebanker for forskjellige språk, inkludert afrikaans, gammelgresk, japansk, nederlandsk, finsk og kinesisk på toppen av engelsk. Den nyeste versjonen av Universal Dependencies kan finnes og lastes ned nederst på denne nettsiden.
290. Webslange
Webhose er en førsteklasses kilde til datasett hentet direkte fra nettstedets depoter og åpnet for publikum. Forskere kan sortere nyhetsartikler etter språk med arabisk, fransk og nederlandsk som bare noen få av språkene med artikkelnummer på mer enn 100 000. I tillegg er de engelske nyhetsartiklene ytterligere delt inn i kategorier som underholdning og sport for å følge anmeldelsen og foruminnleggene. Digitale utgivere og forskere kan dra nytte av å utforske disse datasettene.
291. Wiki-data
Wikidata er en undervurdert kilde til innhold og ideer for både utgivere og forskere. I følge denne siden er det en rekke måter å få tilgang til materialet i datadumpene, selv om bruken av JSON er den som nettstedet anbefaler på det sterkeste. Tilgjengelig og helt gratis for både ikke-kommersiell og kommersiell bruk, all data tilgjengelig her kan nås og lastes ned gratis under Creative Commons-lisensen.
292. Wiki-lenker
Wiki Links ligger komfortabelt innenfor rammen av Google Code, og er et åpen kildekode-prosjekt som søker å gi enkeltpersoner tilgang til det spesielle, unike datasettet. På denne nettsiden kan forskere laste ned README-tekstene, datafiler og Creative Commons-lisensen i det hele tatt. Utgivere eller generelt teknologiorienterte personer har mye å se frem til når de ser gjennom dette enorme datasettet. Bare naviger gjennom nettstedet, klikk og begynn å laste ned filene.
293. Wordnet
WordNet er et engelsk leksikon som består av komponentene av språk, adverb, substantiv, adjektiver og verb som er kategorisert i distinkte grupperinger som deretter brukes til å uttrykke bestemte ideer. Sluttresultatet er et nyttig verktøy som kategoriserer ord etter hvordan de brukes og hva de betyr i stedet for hvordan de høres ut når de uttales. Applikasjonene til WordNet i språklig programmering er notert sammen med de mange publikasjonene og statistikkene som er tilgjengelige på nettstedet.
294. Allen hjerneatlas
Allen Brain Atlas, laget av Allen Institute for Brain Science Resources, er et verktøy for å studere og lære mer om den menneskelige hjernen og hvordan den reagerer når menneskekroppen er frisk, også når det er sykdom. Ved hjelp av atlaset kan forskerne lære om den menneskelige hjernen og dens utvikling samt glioblastom og effekten av kreft på hjernen. Journalister som dekker disse emnene kan besøke dette nettstedet for datasett og informasjon.
295. NITRC
NITRC, eller Neuroimaging Informatics Tools and Resources Clearinghouse, er hvor journalister og utgivere kan gå for neuroimaging. Dette nettstedet er satt sammen og promotert som et initiativ for datadeling av nevroimaging, og er hjemsted for data fra flere prosjekter som 1000 Connectome-prosjektet, Addiction Connectome Preprocessed Initiative, samt INDI-Prospective og Retrospective-prosjektene henholdsvis. Enkeltpersoner kan fritt laste ned dataene via nettstedet. Nevrobilder tatt på ulike stadier har aldri vært så tilgjengelige.
296. HCP ung voksen
Human Connectome Project Young Adult-prosjektet er en fortsettelse av den pågående innsatsen for å lage et nøyaktig kart over det menneskelige connectome slik det vil bli sett hos de fleste normale voksne. Gjennom to faser ble 1200 friske voksne skannet gjennom en kombinasjon av teknikker i hviletilstand fMRI og diffusjonsavbildning. Journalister og utgivere som leter etter informasjon om hjernen, vil ikke finne et annet nettsted med mer data om menneskelig kobling hos friske unge voksne.
297. NIMH dataarkiv
NIMH Data Archive, eller NDA for kort, er ikke så mye en uavhengig datakilde som det er en plattform for distribusjon og lagring av data. På denne nettsiden er det data som har blitt samlet inn i løpet av flere artikler og forskningsprosjekter, samt levering av metoder og verktøy som muliggjør bedre analyse og samarbeid. Datasammendrag er fritt tilgjengelig, og innholdsleverandører som rapporterer det siste innen vitenskap kan bruke denne informasjonen til å bryte nyheter.
298. Nevrodata
NeuroData er dedikert til å forske på det unike forholdet mellom sinnet og hjernen. Takket være nettstedets forpliktelse til åpen vitenskap og reproduserbar forskning, har innholdsleverandører tilgang til en publikasjon og flere datasett som kan nås ved å følge lenkene på nettsiden. Av spesiell interesse for de som ønsker å se dataene for seg selv, er tilgjengeligheten av gratis kode og analyseverktøy som gjør det enda enklere å utforske NeuroDatas arbeid.
299. Neuroelektro
NeuroElectro Project er designet med den hensikt å samle de forskjellige elektrofysiologiske egenskapene assosiert med forskjellige nevrontyper og aggregere det i en enkelt database. Dette prosjektet søker å studere forholdet mellom nevroner i et forsøk på å studere forskjellene mellom ulike nevrontyper. Nettstedet lenker til artikler og viser nevrontyper og elektrofysiologiske egenskaper som er oppdaget så langt. Innholdsleverandører kan stole på dette nettstedet som en kilde til data om nevron-til-nevron-forhold.
300. Open Access Series of Imaging Studies
Open Access Series of Imaging Studies, også kjent av mange som OASIS, er et prosjekt som ble designet med mål om å gjøre datasett med hjerne-MR-er tilgjengelige for det vitenskapelige samfunnet for øvrig. Journalister og forskere kan få tilgang til publikasjoner som sammenligner MR-data mellom voksne, samt et omfattende faktaark fra OASIS sin omfattende artikkel som sammenligner og kontrasterer resultater fra over 400 forsøkspersoner. Informasjonen og verktøyene kan lastes ned fra nettsiden i flere formater.
301. ÅpenfMRI
For journalister som ønsker å få tilgang til MR-datasett uten noe av bryet forbundet med noen andre nettsteder, er OpenfMRI.orgs fokus på å gjøre MR-datasett tilgjengelig for publikum en positiv utvikling. Dette nettstedet kommer direkte fra forskerne selv, og er vert for en rekke datasett, som for eksempel læringsdatasettet for klassifisering, oppgaven med blandede gamblinger og den analoge ballongoppgaven for risikotaking. Variasjonen og mengden av data gjør det mulig for forskere å finne nye veier for undersøkelser gjennom dette nettstedet.
302. Studyforrest
Studyforrest låner i stor grad navnet sitt fra den berømte filmen Forrest Gump, og søker å forstå hva hjernen er i stand til når den må prestere på et høyere nivå mens den kjemper mot naturlig, men like kompleks stimulering. Likevel erkjenner nettstedet at mengden fMRI-data som samles inn fra disse studiene har bredere anvendelser enn det ser ut til å begynne med. Innholdsleverandører kan bla gjennom de 19 publikasjonene som har brukt studyforrest- data og kan til og med få tilgang til dataene direkte.
303. Krystallografi åpen database
Som naturlig forventes av tittelen, er Crystallography Open Database en samling av 385 697 metallorganiske mineraler og forbindelser, organiske og uorganiske krystallstrukturer med det bemerkelsesverdige unntaket av biopolymerer. Innholdsleverandører som ønsker å lære mer om krystallstrukturer kan søke etter strukturformelen eller kjøre et samsvarende søk med muligheten til å bla. Det er også programvare og data på denne siden som gjør denne nettsiden spesielt verdifull innen kjemi.
Lenge ansett som en av de fremste kildene til informasjon om verdensrommet, fortsetter NASA sin tradisjon med å være en uvurderlig ressurs med sitt Exoplanet-arkiv. Denne siden er vert for en rekke interaktive verktøy og programvare som Transit and Ephemeris Service, Periodogram, Confirmed Planets Plotting Tool og muligheten til å interaktivt laste opp filer og søke i tabeller. Innholdsleverandører som søker etter unik innsikt kan bruke disse dataene til å gjøre det neste gang eksoplaneter kommer med store nyheter.
Evnen til å lage tredimensjonale kart over universet er mulig for alle ved hjelp av Sloan Digital Sky Survey, eller SDSS. Både reportere og innholdsleverandører kan få tilgang til algoritmer, bildedata, datasett, veiledninger og videreutvikling av visuelt materiale med det formål å utdanne publikum både formelt og uformelt. Nettstedet diskuterer også eksplisitt å gjøre dataene sine tilgjengelige for publikum via nyheter og sosiale medier. Dette er et uvurderlig visuelt verktøy for innholdsleverandører.
306. StatSci.org
Statsci.org tilbyr en omfattende liste over ressurser som publikum kan få tilgang til og benytte seg av avhengig av deres spesielle behov. Noe av informasjonen inkluderer Electronic Dataset Service og casestudier satt sammen av UCLA. Sammen med rådatasettene er det også lenket til lærebøker på denne siden. Dette inkluderer titler som Handbook of Small Data Sets og Case Studies in Biometrie. Innholdsleverandører på jakt etter statistikk kan ikke gå galt med å se dette.
307. ERIC
ERIC, også kjent som Institute of Education Sciences, er en ressurs som fungerer som en søkemotor for alle som leter etter informasjon om utdanningsfeltet. Det foreløpige søket gir til og med muligheten til å filtrere utelukkende for fagfellevurdert informasjon så vel som for ERIC-baserte fulltekster. I lys av hvor ofte utdanningsbudsjetter og undervisningsmetoder ser ut til å være i nyhetene, er dette en datakilde som journalister bør ha i bakhodet.
308. NTIS
Opprettet kort tid etter avslutningen av andre verdenskrig, ble NTIS (National Technical Information Service) dannet med mål om å bruke data for å hjelpe føderale byråer med å ta informerte databaserte beslutninger gjennom bruk av data. Dette byrået var opprinnelig den amerikanske regjeringens datalager innen vitenskapelig forskning. I dag er nettstedet vert for millioner av publikasjoner om en myriade av emner. Den historiske informasjonen alene gjør dette nettstedet velfortjent som en datakilde for journalister og utgivere.
309. Åpne datasertifikat
Nettstedet til ODI (Open Data Institute) er hjemmet til det som kalles Open Data Certificate, som er et gratis verktøy tilgjengelig på nettet som ble utviklet med det uttrykkelige formålet å kritisk undersøke og gjenkjenne kvaliteten på åpne data. Fra perspektivet til en utgiver eller journalist, er nettstedet også vert for en rekke datasett om emner som spenner fra lister over tilskudd til allergivarsler sammen med lister som kan lastes ned i CSV-format.
310. GitHub-arkiv
GitHub er lett et av de mest populære og kjente datalagrene og arkivene på Internett på grunn av dets enkle samarbeid, arkivkapasitet og tilgjengelighet når det gjelder koding. Enten det involverer forsøk på å lage roboter som kan utføre bestemte oppgaver, eller utvikle applikasjoner, er GitHub et nettsted hvor innholdsutgivere og journalister lett kan snuble over potensielt nyhetsverdige produkter. Arkivet kan nås ved å følge veiledningsinstruksjonene for enten JSON eller Big Query.
311. Sosiomønstre
SocioPatterns er et prosjekt som fokuserer på å finne mønstrene i menneskelig aktivitet og sosial dynamikk gjennom data. Som forventet med et så bredt uttalt mål, har nettstedets informasjon blitt brukt i publikasjoner som tar for seg en rekke emner fra spredning av sykdom til kasusstudier om forskjellene mellom personas online og offline personas. Datasettene er tilgjengelige for visning, og det samme er de publiserte papirene som inneholder informasjon som utgivere sannsynligvis vil finne relevant på et eller annet tidspunkt.
312. Indie kart
Indie Map er resultatet av å ta informasjon fra over 2000 av IndieWebs mest travle nettsteder og rulle dataene inn i interaktive visuelle former som en Social Graph API, et datasett med SQL-spørringsmuligheter og råinformasjonen som ble gjennomsøkt på totalt 5.7 millioner nettsider. Digitale utgivere som er interessert i åpen kildekode-programvare og hva disse dataene kan si om disse nettsamfunnene, kan få tilgang til informasjonen direkte fra nettstedet.
Simon Fraser fortsetter å bygge på sin status som et anerkjent universitet med tilgjengeligheten av datasettet om "Statistics and Social Network of YouTube Videos". Ved å trekke informasjon fra en crawler som brukte YouTubes API for å finne videoer, inneholder filene data om millioner av videoer og brukerinformasjonsdatasett. Nettstedet spesifiserer at nedlasting av datasett kun er for akademiske formål, men det kan være mulig å finne journalistiske kilder og referanser om dette prosjektet gjennom nettstedet.
314. ACLED
ACLED, eller Armed Conflict Location and Event Data Project, tilbyr offentlige data om protester og politisk vold i utviklingsland. Informasjonen som er gitt her inkluderer antall omkomne, informasjon om datoer og steder for volden eller protesten, navnene på de aktuelle gruppene og data om opptøyer og voldelige sammenstøt som har skjedd. ACLED gir tilgang til vanlige rapporter, publikasjoner og bilder samt til data som er tilgjengelig for nedlasting på nettstedet.
315. Canadian Legal Information Institute
The Canadian Legal Information Institute, eller CanLII som det kalles i vanlig språkbruk, er et nettsted som gir gratis tilgang til statuer og deres forskrifter, rettspraksis fra domstoler i forskjellige jurisdiksjoner, inkludert Canadas høyesterett, provins- og appelldomstolene og Queen's Bench, sammen med kjennelser fra ulike administrative domstoler og lovbestemt opprettede organer. Med 301 rettspraksisdatabaser og over 140 000 rettsavgjørelser tilgjengelig for visning, vil journalister og digitale utgivere som dekker juridiske emner ha nytte av å bokmerke dette nettstedet.
316. Senter for systemisk fred
Center for Systemic Peace, eller CSP, er en organisasjon som har dedikert seg til å analysere globale systemer med det formål å ta opp spørsmålet om politisk vold. På denne siden vil journalister som forsker på dette området ha tilgang til analyser om konflikt i Afrika, konflikttrender på globalt nivå blant annet sammen med sammendrag av organisasjonens tre primære publikasjoner som Third World War og CSPs Global Report og Virtual Bibliotek.
317. Correlates of War Project
Fokuset til Correlates of War, eller COW, prosjektet er å hjelpe til med innsamling og distribusjon av kvantitative data som i området internasjonale relasjoner. I tråd med sin forpliktelse til å anvende vitenskapelige prinsipper på data om internasjonale relasjoner, gjør COW sine datasett fritt tilgjengelig for publikum. Disse databasene inneholder tall på informasjon som journalister og forskere kan bruke, for eksempel militariserte konflikter mellom stater, medlemmer av statens system, nasjonale materielle evner og formelle allianser.
European Social Survey, eller ESS, er en undersøkelse som er utført over hele Europa med mål om å måle de ulike atferdsmønstrene, holdningene og troene til ulike befolkninger i ulike nasjoner. Siden journalister ofte er interessert i å få publikums mening, kan ESS Topline-serien som dekker emner som spenner fra europeernes personlige og sosiale velvære, holdninger til velferd, og til og med tilstedeværelsen av alderisme i Storbritannia, styrke en historie i mer måter enn én.
319. Fond for fred
Fondet for fred er en organisasjon som fokuserer på å forebygge konflikter og konsentrere seg om sikkerhet gjennom utvikling av verktøy som kan brukes til å dempe konflikter. I løpet av FFPs karriere har den jobbet i samarbeid med journalister, frivillige organisasjoner, lokale organisasjoner og deres internasjonale motparter, så vel som regjeringer. Enten de leter etter trender, sammenlignende analyser og globale data, kan journalister og utgivere finne materialet de vil ha gjennom nettstedets verktøy for datautforskning i nettleseren.
320. Den generelle samfunnsundersøkelsen
Arbeidet til General Social Survey (GSS) fokuserer på å samle informasjon om ulike aspekter av det moderne amerikanske samfunnet som et middel til å holde seg à jour med holdnings- og atferdstrender og mønstre i befolkningen. Med denne praksisen med trendsporing tilbake til 1972, er de historiske dataene alene en gullgruve for journalister som ønsker å utforske trender. Ved å bruke GSS Data Explorer kan forskere og journalister laste ned, undersøke og til og med evaluere data.
321. Gesis
GESIS er et tysk infrastrukturinstitutt som er dedikert til samfunnsvitenskap. Det tilbyr ulike samfunnsvitenskaper, sammen med forskningsarbeid og tjenester som spenner fra undersøkelsesmetodikk til anvendt informatikk, datainnsamling, studieplanlegging og dataanalyse for å nevne noe av det GESIS gjør. Journalister som er interessert i emner som GESIS-tilnærmingen til metodikk, bruken av overkvalifiserte innvandrere og mer kan finne mye informasjon i publikasjonsdelen.
Fra emner som abort til seksualundervisning er religion så gjennomgående at selv i stort sett sekulære land kan en persons holdning til vanskelige sosiale emner påvirkes av religiøs tro. I Global Religious Futures undersøker Pew Research Center trender i folks holdninger og tro når de forholder seg til globale religioner. Journalister som ønsker å undersøke detaljer som evangeliseringens innflytelse i politikken eller holdninger til steining, kan bruke Data Explorer for å finne svar i tallene.
Indeksen for risikostyring, også kjent som INFORM, er et sted forskere og journalister kan gå til for risikovurderinger i situasjoner der det er fare for en humanitær krise eller katastrofe. Organisasjonen tilbyr lenker til data om emner som barnedødelighet, kjønnsulikhetsindeksen og tørkefrekvenser blant andre tall. Det er også mulig å se og laste ned INFORMs data eller få tilgang til dem via nettstedets interaktive kart.
324. INED
INED, eller det franske instituttet for demografiske studier, er en av de mest produktive kildene til data og statistikk som en journalist kan finne på Internett. Med over 70 publikasjoner som blir forsket på og publisert hvert år for å gå med verdensbefolkningen i grafformat, samt statistikk som måler spørsmål som fruktbarhetsforskjeller mellom kjønnene for nyheter og ressursmetoder. Forskere i jakten på nøyaktige funn fra en anerkjent kilde vil finne dem med INED.
325. Internasjonalt nettverksarkiv
Princetons International Networks Archive tilbyr en unik kombinasjon av publikasjoner, med forskning som Human Development Report 1999 og Global Networks: A Journal of Transnational Affairs tilgjengelig for lesing på dette nettstedet. På denne siden vil journalister kunne se på arkivets omfattende offentlige historiske og oppdaterte data. Emner som dekkes her inkluderer helsetjenester, våpen, bøker, musikk, migrasjon, regioner, Internett, politikk og transport er bare et utvalg av materialet som forskere kan lese her.
326. Internasjonalt program for sosiale undersøkelser
Grunnlagt fra begynnelsen som et middel for samarbeid mellom mennesker fra forskjellige nasjoner, har International Social Survey Program (ISSP) gjennomført undersøkelser hvert år om en rekke emner som er viktige innen samfunnsvitenskap. Temaer gjennom årene har inkludert sosial ulikhet, nasjonal identitet, statsborgerskap, sosiale nettverk og arbeidsorientering blant andre saker. ISSPs funn kan søkes etter år eller etter emne og kan deretter lastes ned på nettstedet.
327. Internasjonale studieforeninger
Journalister eller andre forskere som leter etter informativ, intellektuell diskusjon om problemene når de er relatert til emnet transnasjonale, internasjonale og globale saker, International Studies Association (ISA) samler ekspertisen til forskere, akademikere og politiske eksperter blant andre navn. ISAs Encyclopedia of International Studies inneholder fagfellevurderte essays som er fulle av dybdediskusjoner om emner som angår forskning på dette feltet, samt essays som gir informasjon som er fortalt fra et mer historisk perspektiv.
328. Tverrnasjonale data på nettet
Wesleyans universitets professor James W. McGuires utrolig nyttige side, med passende tittel Cross-National Data on the Web, er en ressursside full av lenker til relevante økonomiske og globale utviklingsdata. Blant datasettene som søker journalister vil kunne oppdage her, er det data om familieplanlegging, utdanningsprestasjoner, underernæring, vann og sanitærforhold, frimarkedsorientering og informasjon som er spesifikk for Latin-Amerika og Karibia for bare å nevne noen fra listen. Datakildene som er oppført her er upåklagelige.
329. Norsk senter for forskningsdata
Norsk senter for forskningsdata er en institusjon som støtter og bistår forskere innen ulike områder for å utføre empirisk forskning som personvern, datainnsamling og analyse, metodikkvurdering og etikk i forskning. Her vil forskerne finne programvare og verktøy utviklet og anbefalt av senteret for en omfattende samling av regionale, individuelle og institusjonelle data som kan nås gratis. Senterets funn i Årsrapporten for forskning og personvern er også alltid interessant lesning.
330. IPUMS
IPUMS er ikke nødvendigvis en datakilde i den forstand som de fleste ville forvente når de hører begrepet, men det er likevel en nyttig kilde for journalister på grunn av sin rolle som aggregator, arkiver og arrangør av dataene som andre enheter gir dem. Eksempelvis fungerer IPUMS USA som et slags datalager for amerikanske folketellingsmikrodata, med data som går så langt tilbake som 1790 og dateres helt til i dag.
331. ND-GAIN
ND-GAIN Country Index, et initiativ som ble arrangert av University of Notre Dame Global Adaptation Initiative, måler et lands motstandskraft mot klimaendringer og andre globaliseringskrefter. Denne indeksen inkluderer sårbarhetsscore på områder som mat, helse, infrastruktur og økosystemer, samt beredskapsscore for så mange som 500 000 datapunkter. Denne informasjonen inneholder to tiår med data fra årene 1995 til 2014 i form av CSV-filer, og denne informasjonen er tilgjengelig for nedlasting.
På dette nettstedet kan journalister og utgivere få tilgang til åpne data om tilstanden til politi og kriminalitet i Storbritannia. Dataene inneholder nyttig statistikk om nabolagsteam, enkeltpolitistyrker, stopp- og ransakingsnummer, samt statistikk om kriminalitet og utfall. Ved å bruke dette nettstedet kan journalister sammenligne politistyrker og se trender innen strafferettspleien. Å få informasjon er like enkelt som å velge datoperiode, velge politistyrke og deretter vente på filen.
333. Paul Hensels generelle internasjonale dataside
Paul Hensels generelle internasjonale dataside er en serie lenker som er gruppert under overskriftene Stater og det internasjonale systemet, Internasjonale geografiske data, Statlige kapasiteter, Samfunnsvitenskapelige datainnsamlinger og allianser, traktater og organisasjoner. Hver ressurs som er oppført på denne nettsiden inneholder toppmoderne data som automatisk vil gi troverdighet til en journalists arbeid. Disse kildene kan inkludere alt fra programvare til datasett og arkiver, men hver lenke som er inkludert her er nyttig.
334. TRAC
I verden etter 911 har terrorisme og dens ødeleggende virkninger på lokalbefolkningen fått mye oppmerksomhet i media. TRAC, på trackingterrorism.org, gir forskere omfattende analyser og informasjon om disse emnene. Denne siden inneholder informasjon om flere tusen forskjellige terrorgrupper. Enkeltbrukerprisen på $500 kan være litt høy foran, men er vel verdt prisen som betales for de som skriver om vold og krigen mot terror.
335. Texas Department of Criminal Justice
Interessert i den indre funksjonen til Texas Criminal Justice System? Nysgjerrig på å finne ut hvem som sitter på dødscelle for øyeblikket? Statens Texas Department of Criminal Justice har rikelig med informasjon fra de siste uttalelsene fra fanger før henrettelse, dødscellestatistikk etter kjønn og rase, samt ytterligere henrettelsesstatistikk og faktaark. Texas Department of Criminal Justice er en så pålitelig kilde for journalister som det kan bli.
336. Integrert system for sivilsamfunnsorganisasjoner
Det integrerte systemet for sivilsamfunnsorganisasjoner, eller iCSO, er designet for å gjøre det lettere for sivilsamfunnsorganisasjoner å kommunisere med departementet for økonomiske og sosiale saker. I tillegg til effektiviteten til det robuste rammeverket, inkluderer nettsiden datasett og kategorier for ytterligere informasjon. Dataene kan sorteres etter sektor, type organisasjon, regionen som er involvert, og organisasjonens ECOSOC-status. Dette er en datakilde som journalister definitivt kan bruke for å finne kilder.
337. Universiteter over hele verden
Universities Worldwide er en database over universiteter rundt om i verden som kan søkes etter mer informasjon. Søket kan gjøres ved verdensoppføring eller filtreres eksklusivt til amerikanske universiteter, og brukere kan også legge til sine egne lenker i prosessen. Datautgivere med en betydelig studentkontingent, eller til og med journalister som ønsker å bekrefte et faktum, kan alle dra nytte av å få tilgang til en database som denne på forespørsel.
338. Uppsala konfliktdataprogram
Dette er nettsiden til Uppsala Conflict Data Program, som er en av de mest kjente leverandørene av informasjon om organisert vold. I løpet av programmets siste 40 år har det også etablert seg for sitt arbeid med å samle inn data fra borgerkrigen. Journalister kan bruke denne datakilden til å søke etter informasjon om spesifikke konflikter og aktører i disse konfliktene, og kan også få tilgang til disse dataene for å laste dem ned.
339. Verdens pop
WorldPop-prosjektet, sluttresultatet av sammenslåingen av AsiaPop-, AfriPop- og AmeriPop-prosjektene, er dedikert til arkivering av romlige demografiske datasett som igjen har applikasjoner som et middel til å gi støtte til katastrofehjelp. Innholdsutgivere og journalister som er involvert i sosiale rettferdighetssaker eller som på annen måte forsker på effektive katastrofehjelpsmuligheter, vil være interessert i dette prosjektet. Forskere kan laste ned dataene eller gjennomgå casestudiene på nettet.
340. Utkast til ekspress
DraftExpress er kanskje mest kjent på internett for sin forskning, pre-draft speiderrapporter, mock draft-valg og dets omhyggelige vedlikehold av spillerhøyder og mål i samsvar med sine historiske data. Utsiktene nevnt på dette nettstedet kommer fra NCAA, videregående skole og til og med internasjonale ligaer. Sportsjournalister eller innholdsleverandører som har til hensikt å tilby basketballrelaterte kommentarer kan henvende seg til DraftExpress-statistikk mens de diskuterer spillere og hendelser etter hvert som de finner sted i sporten.
341. Betfair
Betfair er kanskje mest kjent som siden å gå til for sportsspill. Av interesse for innholdsleverandører og digitale utgivere spesielt, er imidlertid tilgjengeligheten av detaljert historisk informasjon om nettstedets prisdata og historie. Dataene kan nås og lastes ned med eller uten det detaljerte tidsstempelet, samtidig som de tilbyr omfattende data om hesteveddeløp og nettstedets andre markedstilbud fra året juni 2004 til oktober 2017.
342. CRICSHEET
Cricsheet tilbyr en lignende tjeneste til en rekke andre sportsdatahuber, men det er et nettsted som spesialiserer seg utelukkende på å tilby cricketdata. Nettstedet tilbyr statistikk og ball-for-ball-data fra en rekke ligaer, inkludert den indiske Premier League, endagslandskamper, samt tall for herre- og damelag for bare å nevne noen av de større kategoriene. Innholdsutgivere på jakt etter historiske cricketdata kan laste ned dataene i enten CSV- eller XML-format.
343. Tverrnasjonale tidsseriedata
Med politiske, økonomiske, lovgivende og innenlandske konfliktdata som dekker over 200 års data i over 200 nasjoner rundt om i verden, er Cross-National Time-Series Data Archive et av de mest omfattende datasettene på Internett. Dataene lagres, mest praktisk, i et Google Disk-ark som åpnes automatisk når du klikker på kategorien til filen. I bytte mot en sitering kan denne informasjonen ses delvis eller i sin helhet avhengig av forskerens behov.
344. Ford GoBike
Ford GoBike er navnet på sykkeldelingsprogrammet som brukes i Bay Area. Mens mange utvilsomt bruker dette programmet for å holde seg i form og unngå bruk av fossilt brensel, har sykkeldelingssystemet holdt styr på turdataene. Denne informasjonen inkluderer selvfølgelig ikke noe som kan identifisere syklistene, men detaljer som sykkelnummer, starttid, sluttid, type rytter og ankomst- og avgangsstasjoner er inkludert i dataene. Det er verdt å utforske.
345. Sjøtrafikk
Marine Traffic er et selskap som sporer og holder styr på bevegelser til fartøyer og havturer ved hjelp av big data. Typen informasjon som dekkes gjennom Marine Traffics AIS API-tjenester inkluderte fartøyer, informasjon om reisene og data om de aktuelle fartøyene som forventede ankomster, til og med hendelser, bilder, fartøyopplysninger og reiseprognoser. Det er imidlertid prisplaner på dette nettstedet, så det er uklart hvor mye forskning som kan gjøres gratis.
346. Bixi
Bixi-sykkeldelingsprogrammer er kanskje noen av de mest kjente sykkeldelingsprogrammene i noen av de største byene i Nord-Amerika. Interessant nok slipper merket også åpne data som gir informasjon om ting som turhistorikk og stasjonsstatus, samt sammenligninger som kan gjøres mellom medlemmer og sporadiske brukere. Lokale journalister som ser på hvordan enkeltpersoner bruker og tilpasser sykkeldelingsprogrammer i livet deres, har all grunn til å hoppe inn i disse dataene.
347. Ulykkesdatabase
Fra Amelia Earhart til Indonesias AirAsia Flight 8501, fly- og flyulykker er et tema som tiltrekker folks oppmerksomhet. Accident Database arkiverer og lagrer data om luftfartsulykker som har skjedd mellom årene 1920 og 2017. Ulykker som telles i denne databasen inkluderer sivile og militære luftskipsulykker, ulykker som involverte dødsfall av kjendiser eller noen kjente, helikopterulykker med 10 eller flere dødsfall , rutefly og ikke-planlagte passasjerfly som endte med døden.
348. Transport for London
Transport for London er regjeringsorganet som er ansvarlig for å føre tilsyn med offentlig transport i Stor-London-området. Det er tube- og jernbanekart tilgjengelig på nettstedet sammen med en turplanleggingsguide. I tillegg til alle disse praktiske tjenestene, er nettstedet også vert for mange åpne data, inkludert sykling, luftkvalitet, badekar og til og med østers. Alle som er interessert i å se hvordan innbyggere i Stor-London bruker offentlig transport kan dra nytte av å ha tilgang til disse dataene.
349. CMAP
CMAP er ansvarlig for å gjøre regional planlegging og organisering i fylkene DuPage, Lake, McHenry, Kendall, Kane, Cook og Will i Illinois. Som man kan se fra nettstedet, strekker CMAPs ansvar seg til å ta opp spørsmål som samfunnsutvikling, skatter og økonomiske indikatorer, og til og med veier og transitt. Dette er grunnen til at de åpne dataene om områder som regionale indikatorer og reiser er nyttige for en journalist som prøver å forstå det store bildet når det gjelder regionens fremtid.
Takket være et samarbeid mellom Bureau of Transportation Statistics og Federal Highway Administration, samler Freight Analysis Framework inn data som deretter brukes til å vurdere den generelle helsen og ytelsen til fraktsystemet. Denne programvaren samler inn informasjon om detaljer som varetype og tonnasje sammenlignet med avgangs- og ankomststasjonene, og disse dataene har i sin tur blitt gjort tilgjengelige for publikum å få tilgang til og laste ned enten i sin helhet eller i sammendrag.
351. Mozilla Science
Mozilla Science er en åpen kildekode, åpen praksis, samarbeidsprogramvare som er der for å hjelpe til med utvikling og distribusjon av forskjellige datakilder og forskningsresultater. Bortsett fra åpenhetsinteresser, beslutningen om å åpne opp programmer og crowdsource foredlingsprosessen gjør det lettere å forbedre programmene som allerede er der. Med prosjekter tilgjengelig innen en rekke felt, inkludert biovitenskap og medisin blant andre, er det programvareløsninger her som kan representere nyhetsverdig fremgang på feltet.
352. Kule datasett
Attraksjonen når det kommer til Cool Datasets er lett tydelig fra navnet på nettstedet. På denne siden faller datasettene inn under seks generelle kategorier innen myndigheter, underholdning, vitenskap, brukerinnsendinger, diverse og maskinlæring. Journalister som ønsker å utforske dataene og finne historier kan få mest mulig ut av å sjekke ut hva denne nettsiden har å tilby. Det er et alternativ for å utforske datasettene og, hvis mulig, å bidra med datasett også.
353. Åpne Data Monitor
OpenDataMonitor er en plattform som tar offentlige datasett og presenterer dem på en måte som er mer intuitiv og enkel for enkeltpersoner å følge. Forskere kan gå til plattformen for å se et sammendrag av hva de åpne dataressursene er i stand til, og de vil kunne se eksisterende data presentert for dem på en mer visuelt engasjerende måte. Nettstedet forklarer metodikken og referansene, og utgivere skal ikke ha problemer med å finne data som er verdt å publisere.
354. CrunchBase
CrunchBase er kanskje mest kjent for sin vekt på statistikk og sitt engasjement for å få sine lesere tilgang til de beste tilgjengelige dataene. Forretningsorienterte personer kommer til denne siden hver dag for å lære om de siste trendene innen investeringer og industri. Her vil journalister og utgivere finne nyheter og fersk diskusjon om de siste forretningstrendene. I mellomtiden, som en del av det betalte alternativet, er nettstedet også vert for omfattende datasett som kan analyseres ved hjelp av Crunchbases programvareverktøy.
355. Indeks
Indeks er en plattform med et unikt salgsforslag fordi den har noe å tilby alle mellom startups, investorer, analytikere og selskaper. Nettstedet er også vert for informasjon om over 100 000 selskaper i teknologisektoren, samtidig som det tilbyr brukerne muligheten til å sortere, bygge og eksportere regneark. Utgivere og journalister som leter etter potensielle historievinkler kan komme i forkant av forretningsnyheter gjennom denne siden. Indeks kan være uvanlig, men det er ingen tvil om at det er en nyttig ressurs.
356. SEMRUSH
SEMrush er stolt av å være et av de mest veletablerte søkeintelligensverktøyene som er tilgjengelige for markedsførere på nettet. Mellom akademiet og webinarene har forskere alle muligheter til å lære det grunnleggende. Blogg- og nyhetsseksjonene inneholder imidlertid nok informasjon til at utgivere og journalister enkelt kan holde seg oppdatert på alle de siste nyhetene innen nettannonsering og SEO. SEMrushs tjenester har en pris, men det er rikelig med kvalitetsinformasjon som de gir gratis.
357. Ahrefs
Ahrefs er kanskje best oppsummert som en pakke med markedsføringsverktøy som potensielt er nyttige for alle som publiserer innhold på nettet. Nettstedet tilbyr en kombinasjon av tjenester som innholdsundersøkelser, nettovervåking, søkeordundersøkelser og tilbakekoblingsundersøkelser for å hjelpe brukere med å reversere suksessen til konkurrenter. Ahrefs-bloggen er sannsynligvis mest nyttig for nettutgivere i den store sammenhengen, og alene representerer utmerket verdi for de som liker markedsføringen utført med en databasert skråstilling.
358. Engleliste
AngelList, med sitt smart valgte navn, er i utgangspunktet to deler Craigslist og en del LinkedIn med sin vekt på å bringe investorer, jobbsøkere og startups sammen på ett sted. Sammen med dette interessante nettstedkonseptet er det mange muligheter for driftige journalister til å oppdage de hotteste startupene og de nyeste investeringstrendene før de blir mainstream. Med sitt enkle grensesnitt og sin sterke forretningsorientering er dette nettstedet nyttig for profesjonelle på mer enn én måte.
359. Anskaffet
I stort sett alle sektorer kan et bedriftsoppkjøp endre en hel bransje praktisk talt over natten. Acquired er en side som tar på seg oppgaven med å holde publikum informert når det er gjort et oppkjøp i teknologisektoren. Full av statistikk som kan sees på nettstedet for å kunne filtrere søk, vil journalister som skriver om teknologi få mest mulig ut av å gjøre Acquired til en vanlig del av deres daglige nettsurfing.
360. Mattermark
Mattermark er en betalt tjeneste som gjør livet enklere for bedriftens beslutningstakere ved å produsere kvalitetskundelister som tar hensyn til både bedrifter og deres nøkkelmedarbeidere. Mattermark gir omfattende bedriftsprofiler, fleksibilitet med API-en og til og med eksportfunksjoner for å gjøre oppdateringer. Bedrifter som ønsker å målrette sin oppsøkende rekkevidde bedre samtidig som de også sporer resultatene av kampanjene sine, vil tjene mye på å registrere seg for dette.
361. Fintechstartups
FintechStartupsCo fungerer som en type aggregator som holder styr på hvor mye ulike selskaper har vært i stand til å samle inn i sine børsnoteringer. Med et minimalistisk design som veksler mellom «startups» og «news»-fanene, er dette en rask og enkel måte for journalister å holde seg oppdatert på siste innsamlingsnyheter. I mellomtiden vil utgivere som søker etter raskt innhold og raske historier også tjene på å ta en ny titt på hva denne siden har å tilby.
362. Datafox
Bare i tilfelle navnet ikke ga alt bort, er DataFox et selskap som streber etter å gi sine forretningskunder informasjonen de trenger for å maksimere CRM-ene sine og generelt ta datadrevne beslutninger. Dette selskapet tilbyr tjenester som inkluderer konferanse- og firmaintelligens, API-er og bedriftssignaler, og er faktisk en one-stop-shop for bedrifter som fornyer sitt salgs- og oppsøkende arbeid. Digitale utgivere og innholdsleverandører vil kanskje også sjekke det ut.
363. Åpen sending
OpenSpending er en gratis plattform som kan nås praktisk talt hvor som helst i verden, som lar brukere søke og undersøke økonomiske data i det offentlige domene. For ikke-hackende medlemmer av samfunnet er dette et kraftig verktøy for å visualisere og analysere. Journalister, spesielt, kan bruke OpenSpending til å finne interessant ny innsikt og forfølge historievinkler som selskapet foreslår direkte på nettstedet. Som en ekstra bonus er journalister blant yrkene som er spesifikt etterspurt på forumet.
364. ESPN Sports API
Ikke fornøyd med bare å være den mest populære sportskanalen på kabel, utvider ESPN sin innflytelse til koding og APIer. I utviklersenteret tilbyr nettstedet utgivere å velge mellom flere APIer som inkluderer forskningsnotater, maktrangeringer, utkastvalg, kalendere og overskrifter. Det er til og med et API som laster idrettsutøverprofiler, biografier og statistikk i alle de store idrettene. Journalister som forbereder seg på å skrive en historie med sportsinnhold kan bare ha nytte av å bla gjennom disse.
365. Sportsreferanse
For mange sportselskere som liker avansert statistikk og ressurser samlet på ett sted, er Sports Reference en av de beste sidene på nettet. Med historiske data som inkluderer lag- og spillerstatistikk om angrep og forsvar, kan sportsforskere gå så bredt eller så smalt de vil med denne siden. I tillegg er det tall for praktisk talt alle store idretter fra basketball til baseball og separate data for forskjellige college-idretter også.
366. Datasett for millioner sanger
Den passende navnet "Million Songs Collection" står for hele 28 datasett verdt av metadata og informasjon om lydfunksjonene til nøyaktig én million sanger. Stort sett resultatet av Columbia Universitys LabROSA-arbeid sammen med Echo Nest, denne informasjonen er tilgjengelig og vert på Amazons AWS-system. Brukere kan søke etter informasjonen gjennom Infochimps, noe som gjør den enda mer tilgjengelig for journalister på jakt etter uklare trivia, så vel som innholdsutgivere.