Maraming iba't ibang uri ng mga site na nagbibigay ng napakaraming libre, freemium at bayad na data na makakatulong sa mga developer ng audience at mamamahayag sa kanilang mga pagsusumikap sa pag-uulat at pagkukuwento, Ang koponan sa State of Digital Publishing ay gustong kilalanin ang mga ito, bilang nagmula sa mga manual na paghahanap at pagkilala mula sa aming kasalukuyang madla.
1. Kaggle
Ang Kaggle ay isang site na nagbibigay-daan sa mga user na tumuklas ng machine learning habang nagsusulat at nagbabahagi ng cloud-based na code. Pangunahing umaasa sa sigasig ng napakalaking komunidad nito, nagho-host ang site ng mga kumpetisyon sa dataset para sa mga premyong cash at bilang resulta mayroon itong napakaraming data na pinagsama-sama dito. Naghahanap ka man ng makasaysayang data mula sa New York Stock Exchange, isang pangkalahatang-ideya ng mga uso sa paggawa ng kendi sa US, o napakahusay na code, ang site na ito ay puno ng impormasyon.
2. Wikipedia
Imposibleng nasa Internet nang matagal nang hindi nakakapasok sa isang artikulo sa Wikipedia. Sa mga artikulong mula sa ganap na pinagmulan at nagre-refer ng mga makasaysayang talambuhay hanggang sa mga timeline ng malapit at malayong hinaharap, ligtas na sabihin na pinatibay ng Wikipedia ang katayuan nito bilang isang libreng web-based na encyclopedia. Sa pagitan ng entry na nagsisilbing pangkalahatang pangkalahatang-ideya ng paksa at ng maraming libro at online na sanggunian na ibinibigay ng site, ang Wikipedia ay matalik na kaibigan ng manunulat sa maraming aspeto.
Tulad ng maaaring hulaan mula sa pangalan ng website, ang Common Crawl ay naghahanap o "nag-crawl" sa web para sa data na pagkatapos ay iniimbak at binuo nito sa isang bukas na imbakan na maaaring ma-access ng mga user. Para sa dalawang halimbawa ng kung ano ang posible sa site na ito, ang mga virtual na patent marker at komprehensibong listahan ng mga website na nag-aalok ng mga RSS feed ay nagbibigay ng maliit na sampling kung gaano kalakas ang application na ito. Kung mayroong mga paghahambing ng data o site na gusto mong gawin, ito ay isang naa-access na tool para sa paglikha ng orihinal na impormasyon.
4. EDRM
Ang EDRM, maikli para sa Electronic Discovery Reference Model, ay isang site para sa mga legal na propesyonal na nakatuon sa pagsasakatuparan ng potensyal ng e-discovery at ang mga patakaran at inaasahan na pumapalibot sa kung paano pinamamahalaan ang impormasyon. Bilang karagdagan, ang mga miyembro ng EDRM ay nagtutulungan upang bumuo ng mga collaborative na pamantayan, software, at mga tool na pang-edukasyon na idinisenyo upang isulong ang mga layunin ng komunidad. Upang makapulot ng impormasyon tungkol sa mga paraan kung saan maaari at binabago ng teknolohiya ang mga aspeto ng pamamaraan at administratibo ng legal na kasanayan, ito ang site na gusto mong bisitahin.
5. Mahout
Nakatuon ang Mahout sa isang piraso ng software na may parehong pangalan na sumusubok na alamin ang logistik ng pagbuo ng isang kapaligiran na may kakayahang lumikha ng mga application sa pag-aaral ng machine na may mahusay na pagganap na maaaring mai-scale at malikha nang mabilis. Para sa mga mananaliksik na gustong mag-compile at magmanipula ng kanilang sariling mga dataset o subukan ang kanilang mga kamay sa machine learning application, ang piraso ng software na ito ay lalong kapaki-pakinabang. Ang site na ito ay magkakaroon ng mga indibidwal na mahusay sa kanilang paraan sa kasanayan sa software na ito.
Ang Lemur Project ay isang database na nakatutok sa pagsuporta sa pananaliksik sa pagkuha ng impormasyon at paghawak ng mga teknolohiya sa wika ng tao. Sa mga web page na humigit-kumulang 1 bilyon at 10 wika na nakolekta mula Enero, 2009 hanggang Pebrero 2009, ang dami ng materyal na naroroon at suporta ay ginagawa itong isang mahusay na mapagkukunan para sa mga mananaliksik. Sa pagitan ng lahat ng ito at ng karagdagang suporta na makikita sa site, sinumang may interes sa teknolohiya at mga wika ng tao ay maraming makakasama sa site na ito.
Ang Project Gutenberg ay isang direktoryo na nagtatampok ng mga nobela, papel, at iba pang mga gawa sa pampublikong domain. Ang 54,000+ eBook na koleksyon ng site ay mula sa mga kilalang materyal tulad ng mga tulad nina Shakespeare, Mark Twain, at Jane Austen hanggang sa hindi gaanong kilalang mga gawa ng mas hindi kilalang mga pangalan tulad ng Henri Bergson at Samuel Butler. Kumuha man ng isang klasikong nobela para sa pagiging mahusay na magbasa o magsaliksik sa kung paano naranasan ng mga tao ang buhay noong ika-19 na siglo, ang Project Gutenberg ay isang mahusay na mapagkukunan.
Ito ay isang website na naglalaman ng buong dataset na naglalaman ng mga audio feature at metadata ng humigit-kumulang 1 milyong sikat na kanta. Bilang karagdagan sa pangunahing milyong dataset ng kanta, mayroon ding mga numerong dataset na iniambag ng komunidad sa mga nauugnay na kategorya gaya ng mga cover na kanta, mga label ng genre, at lyrics bukod sa iba pa. Ang mga historyador ng musika, mga hobbyist, o mga mananaliksik na nagnanais ng impormasyong ito ay magagawang ayusin ang data nang medyo madali. Maaaring ito ang pinakamalawak na dataset sa paksang ito sa buong Internet.
9. Amazon
Alam ng lahat ang Amazon bilang isang digital retailer, ngunit alam mo ba na ang Amazon ay nagho-host din ng mga libreng pampublikong dataset na bukas para ma-access ng sinuman nang hindi kinakailangang mag-imbak o mag-download ng anuman sa kanilang sariling mga device? Sa data na sumasaklaw mula sa lagay ng panahon, kapaligiran sa kalawakan, at meteorolohiko na impormasyon hanggang sa koleksyon ng imahe na nakatuon sa pagbuo ng mga algorithm na nakakatulong sa computer vision, walang kakulangan ng mga opsyon para sa mga nais ng mas maginhawang paraan upang pag-aralan ang napakalaking dami ng data.
10. Buksan ang Gobyerno Canada
Sa mga interes ng pagtataguyod ng higit na transparency, pagkuha ng mas maraming mamamayan na makisali, at paghikayat sa pag-uusap, ang Gobyerno ng Canada ay nag-aalok ng malawak na data bilang bahagi ng Open Government na inisyatiba nito. Sa site na ito mahahanap mo ang mga dataset sa mga isyung nauugnay sa gobyerno gaya ng mga antas ng kapasidad ng mga homeless shelter sa Canada pati na rin ang mga panrehiyong numero sa mga antas ng partisipasyon ng Anglophones at Francophones sa pampublikong sektor. Sa pamamagitan ng pag-access sa mga dataset ng ganitong uri, hindi na kailangang umasa sa mga istatistika ng ibang tao upang makahanap ng impormasyon.
Ang Data Catalogs, ngayon ay Data Portals, ay nag-aalok sa mga user ng isang maginhawang site para sa pag-browse ng mga bukas na portal ng data mula sa buong mundo. Sa pamamagitan ng pagtatasa at pag-curate ng mga portal ng iba't ibang antas ng mga pamahalaan, ilang NGO, at maging ng World Bank, ang data na magagamit para sa pagsusuri ay napakataas na kalidad. May opsyon ang mga user na mag-browse o mag-ambag ng mga portal ng data. Mula sa pananaw ng pananaliksik, ang iba't ibang paksa at impormasyon ay ginagawang mas maginhawang lugar ang site na ito para magsimula ng paghahanap ng impormasyon.
Ang Data.gov.uk ay isang site na nagbibigay-daan sa mga indibidwal na maghanap at mag-access ng data na inilalathala ng iba't ibang pampublikong katawan, departamento ng pamahalaan, lokal na awtoridad, at ahensya ng gobyerno. Dito makakahanap ang mga mananaliksik ng impormasyon tungkol sa klimang pang-ekonomiya para sa maliliit na negosyo, kalakalan, pag-import, industriya, at pag-export o kahit na magsaliksik tungkol sa mga pagbabayad na higit sa £25,000 na ginawa ng mga departamento ng gobyerno. Sa tahasang sinasabi ng site na ang data ay maaaring gamitin para sa pananaliksik, ang impormasyong sakop dito ay maaaring makabuo pa ng higit pang mga ideya habang pinagdaraanan ito ng mga mananaliksik.
Ang site na ito ay kung saan nagbibigay ang US Government ng bukas na data na maaaring magkaroon ng access ang publiko sa anyo ng mga dataset. Sa itaas ng raw data, nag-aalok din ang site ng ilang mga tool na maaaring magamit upang gumawa ng mga visualization ng data pati na rin ang pagbuo ng mga application para sa web at mobile. Huwag magkamali. Napakalaki ng data na may impormasyon mula sa mga reklamo sa credit card hanggang sa data ng federal student loan program sa mahigit 197,000 dataset. Nag-aalok ang site na ito ng maraming pagkakataon para sa pagbabago at komprehensibong pagsusuri.
14. DataSF
Nag-aalok ang DataSF ng daan-daang dataset na may kaugnayan sa parehong Lungsod at County ng San Francisco. Interesado na makita kung ano ang itinutulak ng mga lokal at rehiyonal na tagalobi? Kailangan mo ba ng mga istatistika sa krimen? I-browse ang tab na Showcase upang makita kung ano ang nagawa ng mga tao sa data o gamitin ang form upang magbigay ng kontribusyon. Ginawa gamit ang Open Data at nag-aalok ng isang akademya, isang blog, at ilang iba pang mga tool, ang site na ito ay hinihimok sa malaking bahagi ng pakikipagtulungan at komunidad. Ginagawa nitong isang asset para sa mananaliksik.
15. DataFerrett
Ang DataFerrett ay naiiba sa maraming site dahil hindi ito isang repositoryo o direktoryo bilang isang tool na nagbibigay-daan sa mga user na i-customize ang data mula sa lokal, estado, at pederal na mapagkukunan sa pamamagitan ng pagsusuri at pagkuha ng data. Binibigyang-daan ng tool na ito ang mga user na gumawa ng mga customized at komprehensibong spreadsheet at pagkatapos ay gawing mapa o graph ang parehong impormasyon nang hindi kinakailangang mag-download o paganahin ang anumang iba pang software. Ang pag-aayos ng malalaking data input at ginagawa itong isang bagay na madaling basahin ay hindi kailanman naging mas madali.
16. Inforum
Sa pamamagitan ng Unibersidad ng Maryland, ginagawang available ng Inforum ang data ng ekonomiya ng US sa publiko. Maraming ahensya ng gobyerno ng US ang nag-ambag sa site na ito hanggang sa punto kung saan ang site ay nagtataglay na ngayon ng libu-libong "economic time series", kung tawagin nito, at naglalaman ang mga ito ng mga numero sa pang-industriyang produksyon, mga indeks ng presyo, mga istatistika ng paggawa, at mga tagapagpahiwatig ng negosyo. Ang data ay malayang magagamit at maaaring ma-access gamit ang alinman sa isang personal na laptop o desktop. Ang mga mananaliksik na gustong tingnan nang mabuti ang hilaw, pang-ekonomiyang data ay may mapagkukunan sa Inforum.
17. Europeana
Ayon sa sariling mga numero ng site, ang mga koleksyon ng Europeana ay may kabuuang higit sa 50 milyong mga tala. Gamit ang mga na-curate na dataset dito, mahahanap ng mga mananaliksik ang impormasyong hinahanap nila sa mas kaunting oras. Kasama sa mga dataset dito ang mga kategorya gaya ng mga modelong 3D, mga mapa ng Italian World War I, at kahit isang koleksyon ng mahigit 20,000 makasaysayang larawan mula sa mga museo ng Lithuanian at iba pa. Para sa alinman sa mga pangkalahatang makasaysayang paghahanap o bilang isang panimulang punto para sa pagdaan sa malalaking talaan ng Europeana, ito ay isang mahusay na mapagkukunan upang magkaroon.
Bukod sa walang tigil na saklaw nito ng mga nagbabagang balita at kaganapan, mayroon ding buong seksyon ang Guardian na nakatuon sa mga blur ng data. Ang mga bahagi dito ay mula sa mga seryosong paksa tulad ng pagiging epektibo ng mga patakaran sa pabahay sa kawalan ng tirahan hanggang sa bahagyang mas magaan ang loob na paksa tulad ng kung aling mga bansa ang may pinakamaraming nanalo ng premyong Nobel. Ang mga mamamahayag at mananaliksik ay walang kakulangan ng impormasyong magagamit sa kanilang sariling mga proyekto mula sa site na ito. Sa tulong ng mabilis na paghahanap, posibleng makahanap ng data sa halos kahit ano.
Hino-host ng National Center for Biotechnology Information, ang Gene Expression Omnibus ay isang site na naglalaman ng “public functional genomics data” na sumusunod sa mga pamantayan ng MIAME (Minimum Information About a Microarray Experiment). Tumatanggap din ang site ng data na naka-array o sequence habang nagbibigay ng mga tool na kinakailangan para mahanap at ma-download ang impormasyon. Ang mga interesado sa pag-aaral ng mga genome o pagkuha ng impormasyon sa paksa ay magkakaroon ng lahat ng data na kailangan nila dito at pagkatapos ay ang ilan.
20. Ang Unibersidad ng Chicago
Matagal nang kinikilala para sa mga kontribusyon nito sa pagbabago at pag-unlad sa mga larangan ng agham panlipunan, ang University of Chicago's Center for Spatial Data Science (CSDS) ay nag-explore sa susunod na hangganan kasama ang pagpasok nito sa spatial analysis at teknolohiya. Ang gawain ng CSDS ay may mga aplikasyon sa halos anumang larangan na kailangang makipaglaban sa espasyo sa pagharap sa mga isyu. Dahil dito, ang mga larangan tulad ng environmental economics, pampublikong kalusugan, at kriminolohiya ay nakinabang lahat mula sa mga application na ito. Ang dedikasyon ng CSDS sa open source software at pamamahagi ng impormasyon nito ay ginagawang mas madaling ma-access ang data.
21. Konect
Sa pamamagitan ng paggamit ng data na nakolekta ng University of Koblenz-Landau's Institute of Web Science and Technologies, ang KONECT (Koblenz Network Collection) ay nag-aalok ng pananaliksik na ginawa sa larangan ng network science at mga kaugnay nitong paksa. Gumagamit ang proyekto ng isang serye ng sarili nitong mga tool sa pagtatasa ng network ng software upang mag-crunch ng mga numero at makagawa ng mga iginuhit na plot at algorithm. Ang KONECT pagkatapos ay direktang nagho-host ng mga resulta ng analytic na gawain nito sa website. Na may higit sa 200 dataset na mapagpipilian, isa itong mapagkukunan na sulit na galugarin.
22. MIdata
Ang MIdata ay isang site na nagsisilbing repositoryo para sa data na dapat gamitin ng data ng machine learning. Ang mga dataset na ito ay maaaring mula sa isang compilation ng mga ekspresyon ng mukha ng tao hanggang sa mas maraming siyentipikong paksa tulad ng paghula kung paano magbubuklod ang mga molekula. Sa mga entry na nahahati sa mga kategorya na nag-aalok ng access sa raw data, mga tutorial sa seksyon ng materyal at mga pamamaraan, pati na rin ang mga gawain at hamon sa pag-aaral, pinapayagan ng site na ito ang mga mananaliksik na mag-parse sa repository para sa mga dataset na interesado.
23. NASDAQ
Ang NASDAQ ay isang tanyag na stock exchange na matagal nang mahusay na mapagkukunan para sa mga mamamahayag at mananaliksik sa paghahanap ng data mula sa mundo ng pananalapi at negosyo. Dito mahahanap mo ang impormasyon sa mga IPO, makasaysayang data ng presyo, at ang nagbabagang balita sa pananalapi na ginagawa ang site na ito na pumunta sa online na destinasyon para sa pinansyal na data. Ang NASDAQ Composite ay nag-aalok din ng mga opsyon sa bayad na data para sa mga gustong gumawa ng mas malalim na pagsusuri. Ito ay isang napaka-respetado at mahusay na itinatag na mapagkukunan.
24. NASA
Mula sa paglapag sa buwan, sa ngayon ay narinig na ng lahat ang tungkol sa ahensya ng gobyernong ito at ang pagpasok nito sa kalawakan. Ang interes sa mga mamamahayag, gayunpaman, ay kung paano ang NASA ay isa ring mahalagang mapagkukunan ng data sa pamamagitan ng Space Science Data Coordinated Archive nito. Dito, nakakahanap ang mga mananaliksik ng data ng misyon ng space science sa mga kategorya tulad ng astrophysics, mga mapagkukunan ng imahe, at heliophysics bukod sa iba pa. Bilang karagdagan, mayroon ding maraming mga puting papel na magagamit sa site upang pumunta sa bagong data na isinumite.
Ang Socrata ay isang site na kumukuha ng data ng gobyerno na available at inilalagay ito sa isang format na nagpapadali para sa mga tao na magsuri, mag-click, at mahanap ang impormasyong hinahanap nila. Partikular na idinisenyo sa mga pangangailangan ng hindi teknikal na mga indibidwal tulad ng mga pampublikong patakarang wonks, mga mananaliksik, mga negosyante, at mga concerned citizen sa isip, ginagamit ni Socrata ang cloud para mag-compile ng data mula sa iba't ibang source. Para sa mga mamamahayag na sinusubukang maunawaan ang bisa ng iba't ibang mga patakaran, ito ay kapaki-pakinabang na plataporma.
26. Quandl
Ang Quandle ay isang site na pangunahing nag-aalok ng pang-ekonomiya at pinansyal na data na naka-format sa mga pangangailangan ng mga propesyonal sa pamumuhunan sa isip. Umaasa sa mahigit 500 na mapagkukunan ng impormasyon mula sa mga mapagkakatiwalaang organisasyon tulad ng CLS Group, UN, mga sentral na bangko, at Zacks bukod sa iba pa upang pagsama-samahin ang data nito, perpekto ang data source na ito para sa mga mananaliksik at mamamahayag na gustong makakuha ng malaking larawan sa isang sulyap. Salamat sa Excel add-in ng site, ang direktang pag-access sa data ay hindi rin naging madali para sa mga user.
27. Pamantasan ng Carnegie Mellon
Ang Carnegie Mellon University ay may karapat-dapat na reputasyon bilang isang mahusay na institusyong pang-akademiko. Ang hindi alam ng maraming tao ay ang StatLab ni Carnegie Mellon ay isang kapaki-pakinabang na mapagkukunan para sa mga mamamahayag sa paghahanap ng data. Kasama sa archive ng dataset na ito ang data sa mga isyu gaya ng mga suweldo sa MLB ng mga manlalaro sa North American noong 1986 pati na rin ang data na idinisenyo para gamitin sa pagsusuri sa katumpakan ng software ng istatistika. Bilang kapalit ng pagkilala, ang mga dataset na ito ay magagamit para sa pampublikong paggamit.
28. UCI
Ang UC Irvine Machine Learning Repository, na tinutukoy bilang UCI, ay isang site na nag-iimbak ng isang tonelada ng kawili-wiling data na magagamit ng mga mamamahayag. Tahanan ng 394 datasets sa pagsulat na ito, ang site ay may karagdagang bentahe ng pagkakaroon ng interface na madaling hanapin. Ang ilan sa mga mas sikat na dataset ay kinabibilangan ng impormasyon sa "Pagkilala sa Aktibidad ng Tao Gamit ang Mga Smartphone", alak, at marketing sa bangko bukod sa iba pang mga paksa. Bilang kapalit ng paggamit ng lahat ng data na ito, humihingi lamang ng pagsipi ang site.
29. UCR
Kung ikaw ay isang mamamahayag na naghahanap sa pagbuo ng machine learning, ang UCR Time Series Classification/Clustering page ay gagawa para sa ilang mahusay na pagbabasa. Ang site ay nagbibigay ng isang kapaki-pakinabang na dokumento ng briefing na magbibigay sa iyo ng lahat ng background na impormasyon na kailangan mong malaman. Kasama ng pangkalahatang-ideya ng kung ano ang nilalaman ng impormasyon, nag-aalok din ang site ng kakayahang direktang i-download ang data. Tandaan lamang na gamitin ang format ng pagsipi na hinihiling ng site kung gagamitin mo ang mga dataset na ito.
30. US Census
Kailangan ng mga istatistika sa kayamanan ng populasyon? Gustong malaman ang eksaktong pagkakahati-hati ng kasarian ng isang partikular na larangan? Ang census ng US ay isang site na mayroong lahat ng data na ito at mas magagamit para sa pampublikong pagtingin. Pagbukud-bukurin ang data ayon sa taon o rehiyon, at mabilis mong mahahanap ang mga istatistika na hindi alam ng karamihan sa mga tao na isinasali sa census ng US kung paano sila dati. Ang mga numerong ito ay magagamit sa Excel at Microsoft Word bilang mga opsyon na ginagawang mas naa-access ang data para sa mga mamamahayag.
31. Wolfram Alpha
Ang Wolfram Alpha ay talagang isang computational engine na nagbibigay-daan sa mga user na ipasok ang data na gusto nilang malaman at makatanggap ng kalkulasyon. Ang makina ay gumagawa ng istatistikal na data at pagsusuri, kimika, mga petsa at oras, at maging ang mga salita at linggwistika bukod sa iba pang mga bagay. Para sa mga user na sumusubok na tumuklas ng mga bagong paraan ng paghawak ng data, ito ay lalong kapaki-pakinabang dahil sa kung paano ito nakapaglalabas lamang ng mga bagong kalkulasyon sa pagpindot ng isang pindutan. Partikular na naninindigan ang mga mamamahayag na makakuha ng marami sa pamamagitan ng paggamit nito bilang pandagdag na mapagkukunan.
32. Yelp
Lumalabas na ang Yelp ay higit pa sa mga restaurant at review ng negosyo ng user. Ang site ng pagsusuri na hinimok ng user na ito ay nagpapanatili din ng isang dataset na nagbibigay sa mga mananaliksik ng access sa mga review, data ng user, at mga negosyo para sa "personal, pang-edukasyon, at akademikong layunin." Ayon sa bilang ng kumpanya, iyon ay 4.7 milyong review at 156,000 negosyo sa 12 metropolitan na lugar na kasama sa dataset. Sa mga bilang na iyon, ang mga materyales at trend na posibleng matuklasan ng mga mananaliksik sa data na ito ay maaaring maging isang kasiya-siyang sorpresa.
33. Data World
Gustong magkaroon ng listahan ng mga inalis na pahina sa Facebook? Paano nakakatunog ang kakayahang pag-uri-uriin ang data ng ekonomiya ng US ayon sa county? Ang Data World ay isang site na nagbibigay-daan sa mga tao na magbahagi, mag-host, makipagtulungan, at subaybayan ang data. Kasama pa nga sa site ang isang seksyon para sa mga mamamahayag na binabalangkas ang mga dahilan kung bakit kapaki-pakinabang ang Data World para sa mga miyembro ng propesyon habang itinuturo din ang mga kakayahan sa pagho-host sa isang naka-streamline na FOIA-predictor pati na rin ang mga pahina na idinisenyo upang tumulong sa pag-aayos. Sa kabuuan, ito ay isang solidong halo ng data at data-hosting.
Pinapatakbo at pinamamahalaan ng CIA, ang World Factbook ay nagbibigay sa iyo ng impormasyon sa mga istruktura ng lipunan, kasaysayan, militar, at mga sitwasyong pang-ekonomiya para sa 267 bansa kasama ang mga mapa, watawat, at isang hanay ng mga time zone na sumusunod sa mga materyales sa mapa ng mundo. Nag-aalok ang site ng masusing at malalim na pagtingin sa paksa sa paraang higit pa sa mga pangunahing kaalaman. Sa madaling salita, ito ay isang data source na dapat nasa arsenal ng bawat mamamahayag.
35. HealthData.gov
Pinamamahalaan ng Kagawaran ng Kalusugan at Serbisyong Pantao ng US, ang HealthData.gov ay nag-aalok ng pampublikong access sa "data ng kalusugan na may mataas na halaga" sa pag-asang makuha ang atensyon ng mga negosyante, gumagawa ng patakaran, at mga mananaliksik. Sa mga lugar ng pag-unlad ng produkto at serbisyo, hindi bababa sa, nasuri ng mga tao ang data na ito at nakakuha ng mga resulta. Maaaring gamitin ng mga mamamahayag na gustong maging nasa pinakamainam na data ng kalusugan o sinusuri ang isang pahayag na inilabas ng isang opisyal ng pangangalagang pangkalusugan ay maaaring gumamit ng site na ito upang makahanap ng mga sagot.
36. UNICEF
Ito ay isang site na nagbibigay ng agarang kredibilidad sa mga mamamahayag na gumagamit ng impormasyong inaalok nito. Kabilang sa mga istatistikang sinasaklaw ng UNICEF ang mga nauugnay sa mga isyu ng kalusugan at karapatang pantao tulad ng edukasyon, kalusugan ng ina, kahirapan sa bata, tubig at kalinisan, at kapansanan sa bata kasama ng maraming iba pang mga kategorya ng mga istatistika na pinananatili. Ito ay kapaki-pakinabang para sa mga mananaliksik dahil ito ay napapanahon at sinusuportahan ng isa sa mga pinakakilalang organisasyon sa planeta. Hindi maaaring magkamali ang mga mamamahayag sa pagbanggit sa data source na ito.
Ang World Health Organization ay isang internasyonal na organisasyon na nangangalap ng mga istatistika at impormasyon sa kalusugan sa buong mundo. Bukod sa impormasyong direktang makikita sa homepage, nag-aalok din ang site ng data sa pamamagitan ng Global Health Observatory. Kasama sa data na ito ang impormasyon sa mga hakbang na ginagawa ng mga bansa tungo sa pangkalahatang pangangalagang pangkalusugan, pananaliksik sa kalusugan at pag-unlad kasama ng iba pang mga kategorya. Ang mga mamamahayag ay makakahanap ng maraming impormasyon tungkol sa mga paglaganap, mga emerhensiya sa kalusugan, at saklaw ng pangangalagang pangkalusugan mula sa isang internasyonal na pananaw dito.
38. Pampublikong Data ng Google
Sa pagkakaroon ng Google Public Data, ang mga mamamahayag ay malinaw na makakaasa sa Google sa maraming paraan kaysa sa isa. Ang search engine juggernaut ay may magagamit na pampublikong data at doon para sa pagsusuri na may higit sa 100 pampublikong dataset sa pangalan nito. Ang paksa ng data ay mula sa napakaseryoso sa mga World Development Indicator at Human Development Indicator hanggang sa kawili-wili na may data sa mga pinakamapanganib na kalsada sa Europe. Ang kailangan lang gawin ng isang mananaliksik ay magpatakbo ng paghahanap at makita kung ano ang mayroon ang Google Public Data.
39. Gap Minder
Nag-aalok ang Gap Minder ng data sa ilang lokal at pambansang tagapagpahiwatig kasama ang mga link at impormasyon sa lahat ng mga tagapagbigay ng data. Gamit ang site na ito, makikita ng mga mananaliksik ang impormasyon tulad ng kung gaano katanda ang mga babae kapag nagpakasal sila sa unang pagkakataon, mga istatistika sa pag-inom ng alak, at mga sanhi ng pagkamatay ng mga bata. Para sa mga mamamahayag na nagsusulat na may pang-internasyonal na pahilig o gumagawa ng comparative data, ito ay isang mahusay na mapagkukunan. Ito ay isang kapaki-pakinabang na mapagkukunan ng data anuman.
40. Google Trends
Ang Google Trends ay isang tool na nagbibigay sa mga mananaliksik ng insight sa kung ano ang hinahanap ng mga tao ngayon sa sandaling ito. Maaaring ihambing ng mga mananaliksik ang data sa mga trend na naganap sa nakaraan at magagamit din ang tool upang gumawa ng mga pagtatantya nang mas maaga, halimbawa sa holiday season, upang makita kung ano ang mangyayari para sa mga paghahanap sa hinaharap. Ang mga trend ng Google ay nag-aalok ng mga graph, maiinit na paksa at maraming pagkakataon upang matuklasan ang balita bago ito maging opisyal na balita.
41. Google Finance
Nag-aalok ang Google Finance ng mabilis at madaling pagkakataon na gumawa ng mas malalim na paghahanap sa isang kumpanyang pinag-iinitan ng mga mamumuhunan. Madaling paraan upang i-filter ang mga teknikal na tagapagpahiwatig at suriin ang pinakabagong mga balita tungkol sa kumpanya sa isang simple at direktang window na nagbibigay-daan sa iyong pag-uri-uriin ang impormasyon nang higit pa. Bilang karagdagan, ito ay libre. Para sa mga mamamahayag na gustong magsaliksik sa pananalapi ng isang kumpanyang nakipagkalakalan, nag-aalok ang Google Finance ng madaling gamitin na interface kung saan maa-access ang impormasyong ito. Sa kasamaang palad, kamakailan ay hindi na ipinagpatuloy ng Google ang ilan sa mga pangunahing tampok tulad ng portfolio ng pananalapi. Narito ang ilang mga alternatibo sa Google Finance .
42. DBpedia
Ang sinumang nagnanais ng mas madaling paraan upang patakbuhin ang mga paghahanap sa Wikipedia ay may dahilan upang matuwa tungkol sa DBpedia. Pinapatakbo ng pangako ng komunidad, ang site na ito ay naglalayong gawing posible na magpatakbo ng mas sopistikadong mga paghahanap laban sa nilalaman ng Wikipedia. Sa Ingles na bersyon na ipinagmamalaki ang 4.58 milyong mga entry na may mga klasipikasyon at nauugnay na mga kategorya, ang site ay mahusay na patungo sa pag-aalok ng komprehensibong saklaw batay sa impormasyon sa Wikipedia. Hindi maaaring magkamali ang mga mamamahayag sa data source na ito.
Para sa marami, ang Pew Research ay nasa itaas na antas kung saan ang mga survey, ulat, at data ng pananaliksik ay nababahala. Sinasaklaw ng site ang mga paksang mula sa mga opinyong pampulitika hanggang sa mga uso sa lipunan at mga pag-unlad sa iba't ibang industriya sa lugar ng trabaho. Ang Pew Research ay mayroon ding function sa paghahanap na ginagawang mas madali kaysa kailanman na ma-access ang impormasyon. Ang mga mamamahayag na nagnanais ng mga napapanahong istatistika at mga natuklasan na nagmumula sa isang mapagkukunan na pinagkakatiwalaan at kagalang-galang ay hindi maaaring magkamali sa pagpunta sa Pew Research.
Para sa mga mamamahayag na gustong malaman ang pinakabagong balita kaugnay ng cancer, ang mga dataset ng Broad Institute ay maaaring ang perpektong lugar upang mahanap ang impormasyon. Kasama rin dito ang impormasyon sa mga karagdagang paksa gaya ng Bioinformatics & Computational Biology pati na rin ang kanser sa utak at pagtuklas ng molecular pattern. Sa madaling sabi, ang site na ito ay nagbibigay sa mga mamamahayag ng isang hakbang sa mga tuntunin ng paghahanap ng malalim na data sa kanser upang gumawa ng mga kuwento mula sa data na ibinigay ng Broad Institute.
45. UNdata
Nag-aalok ang UNdata ng impormasyon sa iba't ibang bansa sa buong mundo. Kabilang dito ang data gaya ng mga teknikal na indicator, social indicator, at economic indicator para sa bawat bansang kasangkot. Para sa mga mamamahayag na gumagawa ng mga kuwento ng interes ng tao o mga kuwento na maaaring makinabang mula sa pagpapatunay ng ilang karagdagang istatistika at data, ang UNdata ay ang perpektong pagpipilian. Ang katumpakan ng data pati na rin ang reputasyon ng UN ay ginagawa itong mapagkukunan ng data na maaasahan ng mga mamamahayag habang gumagawa ng pananaliksik.
46. Google Scholar
Isipin kung sa halip na mag-scroll sa mga website, posible na kumuha ng paghahanap na walang iba kundi mga peer-reviewed na papel at mga materyal na pang-akademiko. Ginagawang posible ng Google Scholar para sa mga tao na makahanap ng mga artikulo sa journal, puting papel, at publikasyon ng mga nangungunang iskolar sa mundo. Gaya ng karaniwang kaso para sa kumpanyang ito, ang Google Scholar ay kasing intuitive nito kung saan ang user ay kinakailangan lamang na magpasok ng isang keyword upang maipalabas ang bola. Ang paghahanap para sa mga akademikong papel ay hindi kailanman naging tapat.
47. Reddit
Kilala sa pinakakaraniwang bilang "ang front page ng Internet", ang Reddit ay isa sa mga pinakasikat na website sa Internet. Bukod sa pagiging tumpak na sukatan ng kung ano ang nangyayari online, ang site ay mayroon ding subreddit, o isang subforum, na nakatuon din sa mga dataset. Nagagawa ng mga user na humiling ng mga dataset, mag-post ng mga mapagkukunan, at magkaroon ng mga talakayan sa pagtatrabaho sa data sa pamamagitan ng mga format tulad ng JSON. Malaki ang pakinabang ng mga mananaliksik sa pag-aaral ng data source na ito.
48. Datamarket
Ginagawa ng Qlik DataMarket na posible para sa iyo na mangolekta at mangasiwa ng data mula sa mga panlabas na mapagkukunan. Binibigyang-daan ng platform na ito ang mga user na humiram sa ilang dataset na may opsyong i-cross-reference ito laban sa data na mayroon na sila upang mapino ang kanilang kahulugan ng mas malawak na konteksto. Mas mabuti pa, kahit na ito ay isang bayad na platform depende sa paksa, mayroong isang libreng opsyon sa Qlik Datamarket din. Ang mga mamamahayag na nag-e-explore sa data ay maaaring gawin ito sa nilalaman ng kanilang puso.
49. Hubspot
Si Hubspot ay palaging isang pinuno ng pag-iisip sa kung sino ang marketing para sa negosyo. Mula sa pananaw ng paggawa ng pananaliksik, ito ay isang site na magsasabi sa mga mananaliksik ng lahat tungkol sa kung ano ang nangyayari sa industriya pati na rin kung ano ang pinag-uusapan ng mga tao sa industriya ng marketing ngayon sa real time. Nagagamit ng mga mamamahayag ang site na ito upang matuto nang higit pa tungkol sa mga uso. Sa tala na iyon, ang Hubspot ay isang mahusay na mapagkukunan para sa mga mananaliksik.
50. Bureau of Justice Statistics
Marahil ay hindi nakakagulat, ang Bureau of Justice ay nagpapanatili ng isang toneladang istatistika. Sa website ng Bureau ay mahahanap mo ang mga numero sa mga pag-aresto, pagkamatay ng mga bilanggo, pagbitay sa pamamagitan ng parusang kamatayan, mga istatistika ng pagpapatupad ng batas, at mga sensus ng mga kulungan. Ang sistema ng hustisyang kriminal ay isang paksa ng patuloy na pagkahumaling para sa publiko at sa mga taong kasangkot dito. Iyan ang dahilan kung bakit mas kapaki-pakinabang ang mga istatistika ng Bureau of Justice para sa mga mamamahayag na nagsasaliksik sa sistema ng hustisyang kriminal.
Ang Uniform Crime Report ay isang koleksyon ng mga istatistika sa krimen sa ari-arian at marahas na krimen na tinipon ng FBI. Habang ang mga ahensyang nagpapatupad ng batas mula sa buong US ay nag-uulat ng data na ito mula noong 1930, ang mga natuklasan ay nai-publish mula pa noong 1958 ay maaaring maghanap sa . Ang mga mamamahayag na naghahanap upang galugarin ang data ng krimen ay may opsyon na mag-access at gumamit ng UCR data tool upang tuklasin ang impormasyong available sa site na ito.
52. Unipormeng Pag-uulat ng Krimen
Ang Uniform Crime Reporting ay resulta ng isang programa na pinag-isipan ng International Association of Chiefs of Police noong 1929. Ang mga numerong nakalap ng FBI dito ay inilalathala ng apat na beses sa isang taon. Sa itaas ng impormasyong ibinigay ng programa ng UCR, kasama rin sa site ang mga ulat sa mga istatistika ng krimen sa mapoot, Law Enforcement Officers Killed and Assaulted (LEOKA), pati na rin ang mga resulta at numero na ibinigay ng National Incident-Based Reporting System.
53. NACJD
Ang NACJD, o ang National Archive of Criminal Justice Data, ay isang site na kumukuha ng impormasyon mula sa mga dataset gaya ng Uniform Crime Reports (UCR) at National Crime Victimization Survey (NCVS) at pagkatapos ay nag-iimbak at namamahagi ng mga istatistika. Idinisenyo upang i-curate, iimbak, at panatilihin para sa ganap na accessibility, ang data ay dumating sa iba't ibang anyo kabilang ang eksperimental, husay, at longitudinal. Sa huli, nag-aalok ito sa mga mamamahayag at iba pang mga mananaliksik ng isa pang paraan upang mailarawan at ma-access ang mga istatistika ng hustisyang kriminal.
54. Unang Databank
Ang First Databank ay isang site na tumatalakay sa data ng gamot. Ang site ay naglalayong i-promote ang mas mahusay at higit na data-driven na pagdedesisyon sa larangan ng mga parmasyutiko. Nagbibigay-daan ito sa mga doktor at clinician na magsimulang mag-isip tungkol sa mga pharmaceutical na gamot sa iba't ibang paraan sa pamamagitan ng paggamit ng makabagong paggamit ng teknolohiya ng First Databank. Mula sa isang propesyonal na pananaw, ang site na ito ay lalong kapaki-pakinabang dahil sa kung paano makakatulong ang data nito sa mga koponan na mag-adjust sa pagdating ng bagong impormasyon. Hindi bababa sa, ito ay isang kapaki-pakinabang na mapagkukunan para sa mga mamamahayag na nagsusulat sa espasyo ng parmasyutiko.
55. FDA
Ang FDA, na kilala bilang Food and Drug Administration, ay ang ahensyang responsable sa pagprotekta sa kalusugan ng publiko sa pamamagitan ng pangangasiwa at pag-apruba ng mga gamot, produktong pagkain, suplemento, bakuna, at kosmetiko kasama ng iba pang mga produkto ng consumer. Bilang isang mapagkukunan, ang FDA ay may mga dataset na magagamit para sa publiko upang bumasang mabuti habang nagbibigay din ng teknikal na data para sa mga taong kumportableng nagtatrabaho sa mga spreadsheet at sinusuri ang impormasyong nagmumula sa mga dataset. Ito ay talagang isang kapaki-pakinabang na mapagkukunan para sa mga mamamahayag.
56. Drugbase
Naisip mo na ba kung gaano kalaki ang binabayaran ng bansa pagkatapos ng epidemya ng droga? Mayroon bang mga alingawngaw ng mga tao na umiinom ng droga nang iba kaysa dati? Nag-aalok ang Drugbase ng database na punung-puno ng mga istatistika sa mga uso at paggamit ng mga gamot sa United States. May mga infographic pati na rin ang mga publikasyon sa mga paksa tulad ng komorbididad ng pagkagumon at sakit sa isip o mga katotohanan sa pagmamaneho na nakadroga (hindi lasing). Ito ay isang mapagkukunan na nagbibigay ng sapat na impormasyon upang makita ang mga uso at gumawa ng mga paghahambing laban sa nakaraang data.
57. UNODC
Ang UNODC, o ang United Nations Office on Drugs and Crime, ay may website na nakatuon sa pagsulong ng layunin nito na tulungan ang mga miyembrong estado na magpatibay ng mas matibay na pamantayan ng pananaliksik, pangongolekta ng data, at forensic. Sa site na ito, mahahanap ng mga mananaliksik ang maraming istatistika at publikasyon na sumasaklaw sa mga paksa tulad ng pagkolekta ng data, pagsusuri ng trend, at mga programa sa pananaliksik kung posible. Isang mapagkukunan na puno ng impormasyon sa iba't ibang paksang nauugnay sa forensic pati na rin ang agham ng paksa.
58. Mga Katotohanan sa Digmaan sa Droga
Ang Drug War Facts ay isang site na nag-aalok ng malawak na talakayan tungkol sa digmaan laban sa droga pati na rin ang mga kahihinatnan ng patakaran. Kabilang dito ang mga istatistika at mga numero sa mga detalye tulad ng mga paghahambing sa pagitan ng halaga ng paggamot kumpara sa gastos ng pag-asa sa pagpapatupad ng batas, sa mga numero sa mga pagtatantya sa paggasta sa pagkontrol sa droga, at isang sari-saring impormasyon sa halos bawat paksang nauugnay sa digmaan laban sa droga. Para sa maraming tao, ito ang pinakakomprehensibong site sa web na may paggalang sa digmaan laban sa droga.
59. National Center for Education Statistics
Ang National Center for Education Statistics, na madalas na tinatawag na NCES para sa maikli, ay ang lugar na pupuntahan para sa anuman at lahat ng istatistikang nauugnay sa edukasyon. Ang site na ito ay may mga istatistika sa estado ng pagpapautang ng mag-aaral, mga projection ng mga uso sa edukasyon, kasama ang mga dataset at mga tool sa paghahambing na maaaring magamit para sa paggawa ng mas malalim na pagsusuri. Maaaring gamitin ng mga mamamahayag ang mapagkukunang ito upang tumuklas ng mga uso, i-verify ang mga pampublikong pahayag, suriin ang mga publikasyon ng National Center for Education Statistics, at maghanap ng mga bagong kuwento sa data.
60. World Bank
Nagho-host ang World Bank ng maraming istatistika at data na pinagsama-sama ng Development Data Group sa sektor ng pananalapi pati na rin ang macro-economics. Posibleng pagbukud-bukurin ang data sa pamamagitan ng paggamit ng mga hashtag. Maaaring pumili ang mga user sa pagitan ng iba't ibang indicator at pumili ayon sa bansa upang masuri ang iba't ibang sukat ng pag-unlad ng pag-unlad. Dahil dito, ito ay isang mapagkukunan na maaaring makinabang sa pagkakaroon ng access sa sinumang tumitingin sa kalagayang pinansyal at/o pang-ekonomiya ng mga miyembrong bansa.
61. Bureau of Labor Statistics
Ang Bureau of Labor Statistics ay isang mamamahayag na pinagmumulan ng mga numero at istatistika dahil nauugnay ang mga ito sa kasalukuyang kondisyon sa pagtatrabaho, kung ano ang nangyayari sa labor market, pati na rin kung paano nagbabago ang mga presyo at nakakaapekto sa ekonomiya ng US. Sa istatistikal na gawain ng ahensya na itinayo noong 1884, walang kakulangan ng pang-ekonomiyang data doon para sa mga mananaliksik na bumasang mabuti. Ang site ay nag-iimbak ng impormasyon sa isang user-friendly na interface at patuloy na ina-update ang data na magagamit para sa paghahanap. Ito ay isang mapagkukunan ng data na nagkakahalaga ng paggalugad.
62. Ang mga Numero
Ang mga blockbuster release ay nakakakuha ng maraming atensyon ng media, ngunit mahirap sabihin kung gaano kahusay ang ginawa ng isang kumpanya nang walang mga numero. Ilagay ang “The Numbers”. Nag-aalok ang website na ito ng pananaliksik at data para sa industriya ng pelikula at entertainment. Maaaring tuklasin ng mga mananaliksik ang mga pagtatantya ng kita, mga inaasahan para sa paparating na mga release, at iba pang data ng pamumuhunan sa pamamagitan ng kapasidad ng search engine na nakabase sa SQL ng OpusData. Ang Numbers ay ang unang lugar o mga mananaliksik na binisita para sa maaasahang istatistika sa mga pelikula at pelikula. Iyan ang dahilan kung bakit ito ay isang mahusay na mapagkukunan.
Ang Film Forever ay isang site na maaaring bisitahin ng mga mananaliksik para sa market intelligence at data para sa industriya ng pelikula sa United Kingdom. Dito mahahanap ng mga user ang lingguhang mga numero sa box office para sa nangungunang 15 release sa UK, pananaliksik sa audience, mga ulat, pag-aaral ng kaso, at ang punong-punong Statistical Yearbook ng organisasyon. Bilang karagdagan, ang site ay mayroon ding kalendaryo na nagpapaalam sa mga manonood tungkol sa kung kailan ilalabas ang susunod na mga istatistika. Ang angkop na lugar ng Film Forever ay ginagawa itong isang partikular na kapaki-pakinabang na mapagkukunan ng data.
64. IFPI
Ang IFPI ay isang site na ipinagmamalaki ang sarili sa pagkakaroon ng daliri sa pulso ng pandaigdigang industriya ng recording. Makakakita ang mga user ng mga nai-publish na ulat na puno ng mga insight sa recorded music, national at global sales data, pati na rin ang mga ulat sa business side ng music industry na nagpapakita kung paano namumuhunan ang mga kumpanya sa musika. Ang mga ulat na ito ay nagbibigay-daan sa mga user na makita kung ano ang nangyayari. Ang site na ito ay panatilihing napapanahon ang mga mananaliksik sa kung ano ang nangyayari sa industriya ng musika sa real time.
65. Statista
Ang Statista ay isang search engine tulad ng Google, tanging sa halip na mga webpage ang site ay nagbabalik ng data at istatistika. Sa isang push ng isang button, ang mga user ay makakakuha ng agarang access sa mahigit isang milyong istatistika at katotohanan. Ang mga gumagamit ay makakahanap ng mga infographic, istatistika sa China, industriya ng pagkain, mga merkado ng consumer, at, sa isang bayad, ang mga dossier at ulat ng industriya ay magagamit din para sa pagtingin. Naghahanap man ng impormasyon sa ekonomiya, social media, o sa Big Mac, ito ang lugar para gawin ito.
66. EPA
Ang EPA, na maikli para sa United States Environmental Protection Agency, ay ang ahensya ng gobyerno na responsable sa pagprotekta sa mga tao at sa kapaligiran sa pamamagitan ng pagpapatupad ng mga batas na itinakda at ipinasa sa Kongreso. Sa website ng EPA, ang mga user ay maaaring tumingin sa ilang mga dataset sa mga paksang mula sa agrikultura hanggang sa mga paksa na kasing kitid ng taunang paglabas sa mga nakakalason na kemikal at mga pamamaraan ng pamamahala ng basura. Ang site na ito ay isang mahusay na pagpipilian para sa mga mamamahayag na nais ng access sa hilaw na data ng kapaligiran.
67. Mga Sentro para sa Pagkontrol at Pag-iwas sa Sakit
Ang website na ito para sa Centers for Disease Control and Prevention ay sinisingil ang sarili bilang isang "one-stop shop para sa data ng pampublikong kalusugan sa kapaligiran". Sa site na ito, makakahanap ang mga mananaliksik ng mga sanggunian at listahan sa mga sistema ng data na tumatanggap ng pambansang pondo habang sinusubaybayan at iniimbak ang impormasyon na nauugnay sa mga alalahanin sa kalusugan ng publiko sa kapaligiran. Sa pamamagitan ng pagtutok sa mga program na gumagana sa pambansang antas at pagiging naa-access sa pamamagitan ng mga kakayahan sa direktang pag-download, ito ay isang mapagkukunan na maasahan para sa pinakabago at pinakatumpak na impormasyon sa web.
68. National Centers for Environmental Health
Itinatag pagkatapos ng pagsasama-sama ng tatlong dating independiyenteng ahensya, ang National Centers for Environmental Health ay ang lugar na pupuntahan para sa mataas na kalidad na impormasyon sa kapaligiran. Nag-aalok ng komprehensibong data na mula sa data ng karagatan hanggang sa mga rekord ng yelo mula sa milyun-milyong taon na ang nakalilipas, kung ang isyu ay may kinalaman sa kapaligiran, malamang na ang website na ito ay magkakaroon ng impormasyon tungkol dito. Ang pangako ng ahensya sa katumpakan at kahusayan sa pangangasiwa nito sa isa sa pinakamalaking archive ng uri nito ay ginagawa din itong isa sa ilang mga site online na nagtataglay, nag-a-update, at nagpapanatili ng ganitong uri ng data.
69. Pambansang Serbisyo sa Panahon
Sasabihin ng National Weather Service ng National Oceanic and Atmospheric Administration sa mga mananaliksik ang lahat ng kailangan nilang malaman tungkol sa lagay ng panahon. Nag-aalok ang site na ito ng mga paghahanap ng data na kinabibilangan ng impormasyon sa mga kategorya tulad ng mga babala at pagtataya, klima, mga pangheyograpikong pagtataya at higit pa. Bilang karagdagan, ito ay may kasamang intuitive, madaling sundan na mapa na may mga tab na maaaring i-click para sa iba't ibang resulta. Kung sinusuri kung ano ang nangyari sa lokal o paghahanap ng hula para sa isang lungsod sa ibang estado, ang site na ito ay mabilis na makakatuklas ng impormasyon.
70. Wunderground
Ang Wunderground ay isang mapagkukunan na nakatuon sa pagtiyak na ang impormasyon sa lagay ng panahon ay magagamit ng lahat sa buong mundo na binibigyang pansin din ang mga lugar na hindi nakakatanggap ng maraming saklaw. Tahasang sinabi ng Wunderground na gumawa ito ng mga hakbang upang matiyak na mahusay ang karanasan ng user sa maraming digital platform. Nangangahulugan ito na ang site ay naa-access sa pamamagitan ng mobile gayundin sa pamamagitan ng PC, na ginagawa itong perpektong mapagkukunan para sa mga mamamahayag na on the go.
71. Weatherbase
Nagbibigay ang Weatherbase ng impormasyon sa mga kasalukuyang kundisyon, average, impormasyon sa klima, at mga kondisyon sa paglalakbay para sa mahigit 40,000 lungsod sa buong mundo sa tulong ng isang simpleng search bar. Gamitin ang kasamang site kung saan naka-link ang site upang makahanap ng karagdagang impormasyon sa paglalakbay sa tono ng mga currency converter, coordinate, at impormasyon ng county kasama ng iba pang nakakatuwang katotohanan. Magagamit din ang Weatherbase upang maghanap ng mga lugar na maaaring bakasyonan batay lamang sa magiging lagay ng panahon. Maligayang paghahanap!
Nai-publish sa ilalim ng International Energy Agency, ang Energy Atlas ay nagpapakita sa mga mananaliksik ng kakayahang makita ang mundo sa pamamagitan ng mga istatistika ng enerhiya. Orihinal na idinisenyo upang maging isang pantulong na mapagkukunan ng data mula sa petsa ng orihinal na pagkakabuo nito, ipinagmamalaki ng site ang isang animated na balanse ng enerhiya ng daloy ng Sankey pati na rin ang ilang mga database upang sumama sa mga publikasyon na maaaring basahin sa pahina ng mga istatistika ng International Energy Agency. Masusumpungan ng mga mananaliksik ang parehong site na ito at ang mga kasamang site nito na lubhang kapaki-pakinabang habang sinasaliksik ang mga paraan kung saan gumagamit ng enerhiya ang mga bansa at lungsod.
73. Bureau of Economic Analysis
Ang Bureau of Economic Analysis, o BEA sa madaling salita, ay naglalathala ng malawak na hanay ng mga kapaki-pakinabang na impormasyon na nagpapahintulot sa mga mananaliksik na panatilihin ang kanilang mga kasabihang daliri sa pulso ng ekonomiya ng bansa. Sa site na ito, may mga numero sa US economic accounts na kinabibilangan ng mga numero sa paggasta ng consumer, GDP, at fixed asset kasama ng iba pang kapaki-pakinabang na data. Maaaring maghanap ang mga mananaliksik ayon sa rehiyon o industriya pati na rin sa antas na may mga opsyon sa paghahanap sa internasyonal, pambansa, at rehiyonal. Subukan ang interactive na data page upang malaman ang higit pa tungkol sa bureau.
74. National Bureau of Economic Research
Ang website ng National Bureau of Economic Research, o NBER, ay isang data source na lumalapit sa ekonomiya mula sa isang analytical na pananaw. Nagho-host ito ng data sa isang malawak na hanay ng mga paksang pang-ekonomiya na may mga entry gaya ng Index of African Governance, ang Opisyal na Ikot ng Negosyo, Eksperimental na Pagkakataon, Mga Index ng Nangunguna at Recession, at ang Macro History Database. Ang NBER ay may mga opisyal na dataset na na-publish at pinagsama-sama sa ilalim ng sarili nitong pangalan pati na rin ang mga index na pinagsama-sama ng iba pang mga publisher.
75. US Securities and Exchange Commission
Ang United States Securities and Exchange Commission ay isang ahensya na kumikilos bilang isang uri ng tagapagbantay sa pagtataguyod ng transparency, pagiging patas, at kahusayan sa mga merkado. Kapansin-pansin, ang site ay may dataset ng financial statement mula Enero 2009 hanggang Oktubre 2017 na may mga update na ginagawa bawat quarter. Ang mga mananaliksik ay maaaring umasa sa site na ito upang manatili sa tuktok ng mga pinakabagong balita dahil ito ay nauugnay sa mga pag-file at ang impormasyon na maaari nitong sabihin sa iyo tungkol sa mga kumpanya at ang estado ng kanilang mga pananalapi.
76. IMF
Ang International Monetary Fund, na kilala rin bilang IMF, ay isang mahusay na itinatag na organisasyon sa internasyonal na sektor ng ekonomiya at pananalapi. Sa website, makakahanap ang mga mananaliksik ng maraming data sa mga paksang iyon. Nagagawa ng mga user na maghanap ng mga dataset ayon sa indicator at bansa at i-browse ang mga chart at mapa habang gumagawa ng pananaliksik. Kasama sa mga sikat na dataset ang direksyon ng kalakalan, pangunahing presyo ng mga bilihin, Financial Soundness Indicator, survey, at mga istatistika ng International Finance kasama ng iba pang mga item ng mahalagang impormasyon.
Orihinal na binuo ng Harvard, ang Atlas ay isang online na tool na nagbibigay-daan sa mga tao na makita at makipag-ugnayan sa sitwasyon ng kalakalan ng isang kumpanya. Kukunin ng Atlas ang impormasyon at magmumungkahi ng iba't ibang mga produkto na posibleng gawin ng bansa upang mapabuti ang kanilang ekonomiya. Ito ay isang tool na ginagamit ng mga gumagawa ng patakaran, negosyante, mamumuhunan, at nakatuong miyembro ng publiko na gustong magkaroon ng mas mahusay na pang-unawa sa klima ng ekonomiya ng isang partikular na bansa. Ang mga tanong tungkol sa kalakalan at pambansang ekonomiya ay hindi kailanman naging mas madaling makuha.
78. Nagnenegosyo
Ang Paggawa ng Negosyo ay resulta ng pagsisikap na gumawa ng mga layunin na pagsusuri ng mga regulasyon sa negosyo. Sinusuri ng site ang halos 200 mga ekonomiya at maraming mga lungsod na sumusukat sa mga detalye tulad ng mga tagapagpahiwatig ng ekonomiya pati na rin ang pagraranggo sa kadalian ng paggawa ng negosyo. Binibigyang-daan ng site na ito ang mga user na suriin ang mga epekto ng iba't ibang uri ng mga regulasyon sa negosyo sa pagitan ng mga bansa at mga ulat ng host pati na rin ang malawak na data ng husay. Bilang karagdagan, ginagawang posible din ng site na gumawa ng mga paghahambing sa paglipas ng panahon.
79. Comtrade
Orihinal na proyekto ng United Kingdom's Department for Business, Energy, and Industrial Strategy kasabay ng Department for International Trade, ang Comtrade ay isang mahusay na mapagkukunan. Ang paghiram ng data mula sa Comtrade Data ng United Nations, ang site ay nagbibigay sa mga user ng isang interactive na tsart na maaaring magamit upang maghanap, maghambing, at magsuri ng mga eksaktong bilang ng kalakalan at mga kalakal sa pagitan ng mga bansa. Piliin lang ang bansang nag-uulat, pumili ng kasosyong bansa, at gumawa ng mga pagpipilian hangga't maaari.
80. Pandaigdigang Data ng Pananalapi
Ang Global Financial Data ay isang source na hindi lang nag-compile ng karaniwang data sa pananalapi, nangangailangan ito ng impormasyon sa pananalapi mula noong 1200s hanggang ngayon. Ang impormasyong ito ay hinango mula sa iba't ibang mapagkukunan kabilang ang mga libro, naka-archive na materyales, akademikong journal, at mga peryodiko ng balita. Bilang karagdagan, ang site ay may mga dataset na gumagamit ng chain linking statistical method. Ang resulta, mula sa pananaw ng user, ay isang mapagkukunan na walang katulad sa Internet dahil sa eksklusibong data nito.
Ang Visualizing Economics ay hindi gaanong mapagkukunan sa kahulugan ng pagtuklas ng data ng termino at higit pa sa isang serbisyong nakatuon sa pagdidisenyo ng mga graphics ng impormasyon at mga interactive na dashboard. Bilang karagdagan, ang Visualizing Economics ay gumagawa din ng pagsusuri at disenyo para sa malinaw na layunin na gawing mas madaling maunawaan ang data ng ekonomiya. Sa pamamagitan ng site na ito, ang mga mamamahayag ay may lehitimong pagkakataon na magtrabaho kasama ang isang propesyonal na may maraming taon ng karanasan sa pagsasalin ng data ng ekonomiya sa isang bagay na mas madaling ma-access sa pangkalahatang publiko.
Ang EU Open Data Portal ay isang proyekto na na-set up pagkatapos ng isang desisyon na ginawa ng European Commission. Sa site na ito, nag-aalok ang mga institusyon ng EU ng data para sa pampublikong pagtingin at paggamit nang walang mga paghihigpit sa copyright at magagamit nang walang bayad. Kasama sa mga dataset ang data ng sangguniang CORDIS, ang rehistro ng transparency, at maging ang buong listahan ng mga tao, entity, at grupong pinatawan ng EU ng mga pinansiyal na parusa. Bilang karagdagan, ang data ay magagamit sa isang bilang ng mga digital na format.
83. Buksan ang Data Network
Ang Open Data Network ay isang site na nagbibigay-daan sa mga user na maghanap ng data ayon sa rehiyon at lungsod. Gamit ang isang malinaw at madaling gamitin na homepage sa site, ang mga mananaliksik ay may kakayahang maghanap ayon sa kategorya ng data, lungsod, at maging sa pamamagitan ng mga sample na tanong. Sa bawat page, pagkatapos dumaan sa alinman sa mga kategorya ng data o mga sample na tanong, may mga maginhawang link din sa mas maraming dataset. Ang organisasyon ng data lamang ay gumagawa ng Open Data Network na isang site na sulit na galugarin.
84. Landmatrix
Ang Landmatrix ay isang site na nag-aalok ng online na database para sa mga deal sa lupa na may layuning isulong ang higit na transparency sa mga pagkuha. Sa totoo lang, magagamit ang tool na ito upang mailarawan at maunawaan ang iba't ibang deal sa lupa. Ang data ay palaging nagpapabuti, nagbabago, at inaayos upang mapabuti ang katumpakan ng impormasyong magagamit. Sa ngayon, ang Landmatrix ay may impormasyon sa mahigit 1,000 deal. Ito ay isang mapagkukunan na nagkakahalaga ng paggalugad para sa mga mananaliksik.
85. Programa sa Pagpapaunlad ng United Nations
Ang United Nations Development Programme ay nagho-host ng maraming kapaki-pakinabang na data sa pag-unlad ng tao sa buong mundo para tuklasin ng publiko. Sa mga petsang karaniwang sumasaklaw mula 1990 hanggang 2015 sa maraming dataset na ito, kasama sa mga index ang buong talahanayan gaya ng mga trend sa index ng human development, index ng hindi pagkakapantay-pantay ng kasarian, at ang agwat ng kasarian sa kurso ng buhay. Maaaring hanapin ng mga mananaliksik ang data nang direkta sa pamamagitan ng search bar at pumunta din ayon sa bansa kung ang layunin ay dumaan sa tsart.
86. OCED
Ang OECD, na kilala bilang Organization for Economic Co-operation and Development, ay may site na nakatutok sa pagtulong sa mga pamahalaan sa mga hakbangin laban sa kahirapan at kaunlaran sa pamamagitan ng katatagan at paglago ng ekonomiya. Sa site na ito, makakahanap ang mga mananaliksik ng peer reviewed na mga materyales, publikasyon, pati na rin ang mga pamantayan at argumento na pabor sa pagtatakda ng mga pamantayan. Ang OECD ay nagho-host din ng isang factbook na nagbibigay ng isang solidong economic reference tool upang sumama sa ilang mga survey at hula sa pang-ekonomiyang pananaw na makikita sa mga pahina nito.
87. Kagawaran ng Kalusugan at Serbisyong Pantao ng US
Ang US Department of Health at Human Services ay nagpapatakbo ng isang site na nagbibigay ng impormasyon sa President's Council on Fitness, Sports, and Nutrition. Sa mga katotohanan at data na pinagsama-sama sa tulong ng ilang mga eksperto sa mga kaugnay na larangan tulad ng mga chef at atleta. Bilang karagdagan, ang site ay mayroon ding maraming mga istatistika. Ang mga mananaliksik ay makakahanap ng mga katotohanan sa pisikal na aktibidad ng mga bata, ang mga gawi na nagpapalakas ng kalamnan ng mga matatanda, pati na rin ang impormasyon sa mga gawi sa pagdidiyeta ng publiko, pati na rin ang labis na katabaan sa maraming iba pang mga katotohanan at istatistika.
88. Mga Kasosyo sa Pag-access ng Impormasyon para sa Pampublikong Pangkalusugan Workforce
Ang Partners in Information Access for the Public Health Workforce ay isang proyektong naganap bilang resulta ng mga pampublikong organisasyong pangkalusugan, mga ahensya ng gobyerno ng US, at mga aklatan na dalubhasa sa agham pangkalusugan. Ang mga pahina ng paksa sa site na ito ay kinabibilangan ng mga paksa tulad ng mga gawad at pagpopondo, promosyon sa kalusugan at edukasyon sa kalusugan, at literatura at mga alituntunin. Sa pamamagitan ng seksyong Mga Paksa sa Pampublikong Kalusugan, mayroon ding data sa mga paksa tulad ng bioterrorism, genomics ng pampublikong kalusugan, at kalusugan ng publiko sa ngipin upang pangalanan ang ilang paksa.
Sa nakalipas na tatlong dekada, ang United Health Foundation ay nagbibigay ng impormasyon sa mga ranggo ng kalusugan para gamitin bilang isang paraan ng pagsukat ng pampublikong kalusugan. Ang site ay nagho-host ng maraming mga ulat at publikasyon na kinabibilangan ng mga ulat sa kalusugan ng mga naglingkod, mga senior na ulat, kalusugan ng kababaihan at mga bata, taunang ulat, at kahit na mga maikling salaysay sa mahahalagang paksa sa larangan. Gamitin ang interactive na mapa upang galugarin ayon sa rehiyon at matuto ng higit pang impormasyon. Mayroon ding search bar para sa karagdagang nabigasyon kung naghahanap ang mga mananaliksik ng mas tiyak.
90. Medicare
Sa Estados Unidos, ang Medicare ang pangunahing paraan na umaasa sa maraming tao para sa segurong pangkalusugan at access sa medikal na paggamot. Kasama ng mga serbisyong inaalok nito sa real time, nag-aalok din ang Medicare ng data sa mga pamantayan at kalidad ng paggamot sa mga pasilidad at ospital sa pamamagitan ng tsart at panuntunan ng paghahambing nito. Ito ang opisyal na dataset na ginagamit ng website ng Hospital Compare at puno ito ng data na maaaring i-download sa Excel para sa karagdagang kadalian ng pag-access.
91. Surveillance, Epidemiology, at End Results (SEER)
Ang Surveillance, Epidemiology at End Results, na kilala rin bilang SEER, ay may isang site na partikular na kapaki-pakinabang bilang isang mapagkukunan ng impormasyon sa mga istatistika sa cancer. Nagho-host ito ng mga buod ng istatistika na nagbibigay-daan para sa pagsasaliksik sa mga numerong nauugnay sa cancer na maaaring pag-uri-uriin ayon sa lugar ng cancer, etnisidad, lahi, edad, kasarian, at maging ayon sa uri ng data. Nagho-host din ang site ng publikasyon, mga dataset, at software na magagamit ng mga mananaliksik para sa mas malalim na pagsusuri.
Ang Amnesty International ay isang organisasyon na matagal nang tagapagtaguyod ng karapatang pantao at hustisya sa buong mundo. Nangyayari rin itong magho-host ng maraming data sa katayuan ng mga karapatang pantao sa buong mundo pati na rin ang impormasyon sa mga partikular na kalupitan at krimen laban sa sangkatauhan sa iba't ibang punto bilang bahagi ng taunang ulat nito. Maaaring gamitin ng mga mananaliksik ang impormasyon upang gumawa ng mga paghahambing sa pagitan ng iba't ibang taon at upang makita kung paano umunlad o regress ang iba't ibang bansa sa larangan ng karapatang pantao.
93. Human Rights Data Analysis Group
Mula nang mabuo ito 25 taon na ang nakakaraan, ang Human Rights Data Analysis Group ay nag-aaplay ng mga siyentipikong prinsipyo sa mga paglabag sa karapatang pantao sa iba't ibang bansa sa buong mundo. Ang site ay nagho-host ng mga publikasyon na nai-publish sa mga kagalang-galang na media outlet tulad ng Washington Post at mga pormal na publikasyon sa pamamagitan ng mga publisher ng Macmillan na pinagsunod-sunod ayon sa taon. Kasama ng mga organisadong publikasyon nito sa nakalipas na mga taon, mayroon ding mga proyektong nagaganap sa buong mundo. Para sa mas teknikal na pagtingin sa mga paglabag sa karapatang pantao, ito ay isang mahusay na paghahanap.
94. Data ng International Relations at Human Rights
Ang site na ito ay nagho-host ng mga database na pinagsama-sama ng maraming kilalang organisasyon, unibersidad, at kahit na mga ahensya ng gobyerno. Ang mga halimbawa nito ay ang Manifesto Project, ang Minorities (at Risk) Project, ang Comparative Welfare States District, at ang Armed Conflict Database. Mayroong ilang mga proyekto tulad ng Polity IV Project na bumalik sa 1800s. Samantala, ang mga proyekto tulad ng Stockholm International Peace Research Institute (SIPRI) ay sumusukat sa mga paglilipat ng armas, internasyonal na paggasta sa militar, at mga uso sa seguridad. Ang pinakamahusay na paraan upang pahalagahan ang data ay ang magtungo sa site at mag-explore.
95. Uppsala Conflict Data Program
Ang Uppsala Department of Peace and Conflict Research, madalas na tinutukoy bilang UCDP, ay nagho-host ng isang napakalaking database na tinatawag na UCDP Conflict Encyclopedia. Ito ay isang site na nagbibigay-daan sa mga user na mag-click at galugarin ang data na pinaghiwa-hiwalay na ng departamento. Maaaring i-click ang mga mananaliksik sa pamamagitan ng website at i-download din para sa karagdagang pagmamanipula at pagsusuri. Ito ay isang mapagkukunan na mabibilang at maisangguni para sa kalidad ng impormasyon na ipinamahagi sa isang madaling paraan.
96. Kagawaran ng Paggawa ng Estados Unidos
Ang Kagawaran ng Paggawa ng Estados Unidos ay nagho-host ng maraming data ng ekonomiya tungkol sa mga istatistika sa kawalan ng trabaho at trabaho. Naturally, kasama sa mga numerong ito ang mga database na kinabibilangan ng mga istatistika ng malawakang tanggalan sa trabaho, mga projection sa trabaho, mga pagbubukas ng trabaho at turnover sa lugar ng trabaho, mga istatistika ng pambansang pagtatrabaho, at maging ang mga istatistika ng paghahambing sa internasyonal na paggawa. Ang site ay nagbibigay ng impormasyon na napapanahon at tumpak habang sinusubaybayan ng Kagawaran ng Paggawa ang lahat ng ito. Ito ay isang kagalang-galang na mapagkukunan na may suporta ng gobyerno para sa mga layunin ng pananaliksik.
97. Pangangasiwa ng Maliit na Negosyo
Matagal nang napatunayang mapagkukunan ang Small Business Administration para sa mga negosyante at iba pang naghahangad na negosyante. Ang site na ito ay nagho-host ng isang tonelada ng mga istatistika sa trabaho pati na rin ang impormasyon na nagpapahintulot sa mga mananaliksik na magsagawa ng pananaliksik sa merkado at mapagkumpitensyang pagsusuri. Dito mahahanap ng mga mananaliksik ang mga numero, istatistika, at mga tool na magagamit upang tumuklas ng karagdagang data. Para sa impormasyon sa mga istatistika ng maliit na negosyo mula sa isang employer at pananaw ng negosyo, ito ay isang mahusay na mapagkukunan na maaaring puntahan ng mga mamamahayag anumang oras.
98. Crowdpac
Ang Crowdpac ay isang platform na nagbibigay-daan sa mga kandidato sa pulitika na mangalap ng pondo at mag-organisa. Dahil sa ideya na mayroong ilang mga kandidato sa kongreso bawat halalan na karaniwang tumatakbo nang walang kalaban-laban, pinapayagan ng site na ito ang mga nakatuong mamamayan na mag-organisa ng suporta. Sa mga artikulong tumatalakay sa mga nauugnay na isyung pampulitika tulad ng gerrymandering na sumama sa mga karagdagang paksa tulad ng mga karapatang sibil at pambansang seguridad, ang site na ito ay kumakatawan sa isang mahusay na pagkakataon upang maunawaan at malaman kung ano ang nangyayari sa katutubo na eksena sa pulitika.
99. Gallup
Ang site na ito ay tahanan ng sikat na Gallup polls. Dalubhasa ang Gallup sa analytics na nagbibigay-daan sa mga gumagawa ng desisyon sa organisasyon na lutasin ang mga problema sa pamamagitan ng diskarteng nakabatay sa data sa paglutas ng problema. Higit pa rito, ang device na iminungkahi ng Gallup ay kadalasang kapaki-pakinabang para sa mga solusyon sa pagmamaneho. Isa itong source na kinikilala bilang gold standard sa data at advanced analytics. I-browse lang ang site upang galugarin ang mga ulat sa lahat mula sa estado ng pandaigdigang lugar ng trabaho hanggang sa pagtalakay sa pagiging produktibo ng US.
100. Aklatan ng Berkeley
Ang Berkeley Library ay nagho-host ng isang buong compilation ng mga istatistika at data para sa Political Science na pananaliksik sa site nito. Sa pahinang ito, makakahanap ang mga mananaliksik ng isang toneladang link na nagbibigay sa mga mananaliksik ng access sa ilang dataset pati na rin ang kapasidad na bumuo ng sarili mong dataset. Kabilang sa mga ito ang Historical Statistics of the United States (HSUS), ang Millennial Edition, ang Data Planet, ProQuest Statistical Insight, at ang Inter-university Consortium para sa Political and Social Research. Mayroong ilang oras ng data upang marating.
101. Mga Serbisyo ng Estado ng RAND
Para sa mga hindi nakakaalam, ang RAND Corporation ay isang organisasyon na dalubhasa sa pananaliksik sa mga hamon sa pampublikong patakaran. Sa mga kliyente at isang portfolio na sumasaklaw sa lahat ng antas ng pamahalaan, ang korporasyon ay isang mapagkukunan ng kalidad na pananaliksik para sa mga layunin ng paggawa ng desisyon. Ang sangay ng korporasyon sa US ay nagho-host ng isang set ng mga istatistika ng database sa website nito. Dito mahahanap ng mga mananaliksik ang impormasyon tungkol sa K-12 na edukasyon, kalusugan, negosyo, at ekonomiya kasama ng iba pang mga kategorya na tumutugon sa mga isyu na may kaugnayan sa kabutihan ng publiko.
102. Roper Center para sa Public Opinion Research
Pinapatakbo at pinapatakbo sa pamamagitan ng Cornell University, ang Roper Center for Public Opinion Research ay dalubhasa sa pagkolekta, pamamahagi, at pagpepreserba ng data ng opinyon ng publiko. Bilang isang halimbawa ng uri ng impormasyon na maaaring matuklasan ng Roper Center, ang mga mananaliksik ay maaaring magkaroon ng access sa data mula sa halalan sa US pati na rin ang isang link sa isang archive ng higit sa 23,000 mga dataset. Kung ang mga mamamahayag ay naghahanap ng pampublikong reaksyon sa pulitika o sa isang kamakailang takot sa kalusugan, ang site na ito ay halos tiyak na mayroong impormasyon.
103. Sinabi ni Transportation Gov
Pinapatakbo at pinapatakbo ng Bureau of Transportation, ang site na ito ay may data na sumasaklaw sa malawak na hanay ng mga paksang nauugnay sa transportasyon. Kasama sa mga mapagkukunan sa site na ito ang mga ulat sa enerhiya, kaligtasan ng pasahero, enerhiya, pagganap ng system, ekonomiya ng transportasyon, imprastraktura at transportasyon ng kargamento. Ang mga gumagamit ay maaari ring pag-uri-uriin at i-access ang data na inaalok sa site na ito ayon sa lokasyon at heograpiya. Ito ay isang site na nagbibigay-daan sa mga mananaliksik na malaman ang lahat ng posibleng asahan nilang malaman tungkol sa mga paksang nauugnay sa transportasyon.
104. Trade Trade
Ang Travel Trade ay isang site na nagho-host ng data tungkol sa pag-alis ng mamamayan ng US mula 1996 hanggang 2016 sa pagsulat na ito. Ang nakasaad na layunin ng mapagkukunang ito ay tulungan ang mga interesadong miyembro ng pangkalahatang proseso ng publiko at maunawaan kung paano gumana ang pandaigdigang turismo at internasyonal na turismo sa mga nakaraang taon. Parehong magagamit para sa pag-download pati na rin para sa online na pagtingin, ito ay isang naa-access na piraso ng impormasyon. Madaling magagamit ng mga mananaliksik ang data na ito upang maghanap ng mga uso at gumawa ng mga paghahambing.
105. Skift
Ang skift ay isang site na nakatutok sa pagbibigay ng katalinuhan at data sa industriya ng paglalakbay. Kabilang sa iba pang mapagkukunan ng data, nagho-host ang kumpanya ng pananaliksik, mga kumperensya, at mga newsletter na nagbibigay-kaalaman para sa mga subscriber at mananaliksik na mapagpipilian. Sinusuri ng Skift ang mga paksang gustong malaman ng mga indibidwal sa sektor ng paglalakbay gaya ng kung saan dumarami ang paglalakbay ng mga tao, pagtukoy ng mga bagong merkado, at maraming karagdagang impormasyon sa teknolohiya sa paglalakbay na may opsyon ang mga mananaliksik na tuklasin.
106. Geoba.se
Ang Geoba.se ay ang perpektong site para sa mga taong gusto ang mga katotohanan at walang iba kundi ang mga katotohanan tungkol sa isang lungsod o lokasyon. Gamit ang search engine sa homepage, ang paghahanap ng mga coordinate, impormasyon para sa paglalakbay, panahon, at maging ang lokal na footage sa webcam ay ilang simpleng keystroke na lang ang layo. Nagho-host din ang site ng page na nagbibigay ng impormasyon sa mga ranking sa mundo na maaaring paliitin ayon sa rehiyon at bansa. Sa madaling salita, ito ay isang mapagkukunan na magbibigay ng purong data at istatistika.
107. Paglalakbay sa US
Nagho-host ang US Travel ng isang site na pinapatakbo at pinapanatili ng US Department of State. Ang nakasaad na misyon ng site ay layunin nitong protektahan ang buhay ng mga mamamayan ng US na pupunta sa ibang bansa. Dahil dito, ang source na ito ay nagho-host ng mga istatistika, impormasyon, at mga ulat sa mga paksang gaya ng mga pasaporte sa US, mga visa sa US, pag-ampon sa iba't ibang bansa, pagkamatay sa ibang bansa, at pagdukot sa mga magulang sa ibang bansa. Maaaring gamitin ang impormasyon habang nagpaplano ng mga biyahe ngunit maaari ding gamitin upang tukuyin ang mga pangmatagalang trend na may mga istatistika mula 1996 hanggang 2016.
Pinondohan ng Economic and Social Research Council, ang koleksyon ng UK Data Service ay nag-publish ng malawak na hanay ng data. Ang site na ito ay may impormasyon na kinabibilangan ng mga materyales tulad ng data ng negosyo sa mga cross-national na survey, mga survey na inisponsor ng gobyerno ng UK, at maging ang data ng census ng UK. Karaniwan, ang website ay idinisenyo sa mga pangangailangan ng mga mag-aaral at mananaliksik sa isip. Bilang karagdagan, may mga gabay, mapagkukunan, at pagtuturo na nag-aalok ng mga gabay at mapagkukunan na makakatulong sa mga mananaliksik na maunawaan at magamit nang mabilis ang mga tool sa site na ito.
109. Data.gov.au
Pinapatakbo at inilathala ng gobyerno ng Australia, nag-aalok ang Data.gov.au ng madaling pag-access at paghahanap ng bukas na data. Ang site na ito ay tahasang itinuturo na ang data ng gobyerno ay maaaring gamitin upang bumuo ng mga tool at application na siya namang magagamit para sa kapakinabangan ng mga Australiano. Hindi lamang mayroong access na ibinigay sa mga bukas na dataset, ngunit mayroon ding hindi na-publish na data na maaaring ma-access nang may bayad. Para sa mga mananaliksik na gustong magsagawa ng mas malalim na pagsusuri, nag-aalok din ang site ng Data Toolkit.
110. Twitter
Alam ng lahat ang Twitter para sa mabilis nitong mga pag-uusap, maiikling mensahe, at katayuan nito sa sikat na kultura bilang sentro ng mga nagbabagang balita. Ang hindi alam ng maraming tao, gayunpaman, ay mayroon ding mga tool sa developer ang Twitter na nagpapadali sa pag-filter at pagtuklas ng impormasyon. Ang mga tool na ito ay nagpapahintulot sa mga mananaliksik na tingnan ang mga uso at i-filter ayon sa heograpiya. Kung nagbabasa man ng mga nagte-trend na hashtag o naggalugad sa mga tool ng developer, ang Twitter ay isang mapagkukunang mamamahayag na matagal nang ginagamit ng mga mamamahayag.
111. Instagram
Ang Instagram ay hindi lamang para sa paggusto sa mga cute na larawan ng pusa at kaibig-ibig na mga larawan ng sanggol. O hindi bababa sa, ito ay hindi kailangang maging. Ang app ay may nakakagulat na sopistikadong hanay ng mga tool ng developer na nagpapadali sa pag-unawa at pagsasaliksik sa audience. Bilang karagdagan, ang mga hashtag at ang mga pahiwatig na ipinahayag ng mga larawang pino-post ng mga tao pati na rin ang mga indibidwal na na-tag sa mga ito ay maaaring maging kayamanan ng impormasyon. Ang Instagram ay isang kapaki-pakinabang na paraan upang matuklasan kung ano ang nagte-trend sa iba't ibang sektor.
112. Apat na Square
Para sa uri ng pananaliksik kung saan mahalaga ang lokasyon, ang Four Square ay isang kapaki-pakinabang na mapagkukunan ng data dahil sa napakalaking database nito at lahat ng impormasyong naipon nito. Sa panlabas, mayroon itong gabay sa lungsod na nagbibigay ng mga rekomendasyon para sa mga gumagamit sa lakas ng komunidad. Ang Four Square ay mayroon ding mga tool ng developer na nagbibigay-daan para sa karagdagang pag-access ng impormasyon sa pamamagitan ng Places Database. Magagamit ito ng mga mamamahayag upang matuto nang higit pa tungkol sa mga partikular na lokasyon at tungkol sa mga taong gumagamit ng app.
113. New York Times
Itinuturing ng marami bilang isang iginagalang na miyembro ng Fourth Estate, kakaunti ang mga mamamahayag na hindi nakarinig ng New York Times. Gayunpaman, ang madalas na hindi napapansin ay ang paggamit ng New York Times bilang pinagmumulan ng data sa pamamagitan ng API nito. Makakahanap ang mga mananaliksik ng mga artikulo noong 1851 ayon sa buwan, maghanap ng mga artikulo, at kahit na makahanap ng mga review ng libro. Ang API na ito ay nagbibigay-daan para sa paghahanap batay sa mga view, pagbabahagi, at email at maging sa paghahanap at pag-access ng mga komento.
114. AP
Ang Associated Press ay may permanenteng lugar sa kulturang popular bilang pinagmumulan ng napapanahon at tumpak na balita. Salamat sa mga tool ng developer nito, isa rin itong kapaki-pakinabang na mapagkukunan ng data para sa mga mamamahayag. Sa pagsulat na ito, magagamit ng mga mananaliksik ang mga tool na ito upang lumikha ng sarili nilang pag-edit habang nagda-download ng mga larawan at video. Ang antas ng nilalaman ay lumilitaw na nakadepende sa uri ng plano na ginagamit ng mga mananaliksik, ngunit ang Associated Press API gayunpaman ay nagbibigay-daan sa mga user na dalhin ang proseso ng pananaliksik sa ibang antas.
115. Lima Tatlumpu't Otso
Maaaring pamilyar na ang mga mamamahayag kay Nate Silver at Five Thirty Eight at sa kanyang istatistikal na modelo dahil sa kanyang minsang hindi inaasahan ngunit kadalasang tamang mga hula. Ang Five Thirty Eight ay may GitHub na nagho-host ng mga dataset pati na rin ang coding na ginamit sa buong kasaysayan ng site. Ang mga dataset ay nagtatampok ng mga nakakatuwang paksa tulad ng data sa masasamang driver, ang Avengers, at ang survey sa etiketa sa paglipad. Kasabay nito, mayroon ding mga file na tumutugon sa bahagyang mas seryosong mga bagay tulad ng kaligtasan sa eroplano at mga krimen ng poot.
116. IMDb
IMDb ay itinuturing ng marami bilang ang pinakakomprehensibong site sa web na may paggalang sa industriya ng pelikula at pag-arte. Kung may lalabas na pelikula at gustong malaman ng mga tao kung sino ang gumaganap dito o makita ang pangkalahatang reaksyon ng publikong pupunta ng pelikula, malamang na mapunta sila sa site na ito sa isang punto sa kanilang paghahanap. Nagho-host din ang IMDb ng ilang dataset na nire-refresh araw-araw at available para sa komersyal at hindi pangkomersyal na paggamit.
117. KAPSARC
Ang KAPSARC ay isang data portal na nagho-host ng kabuuang 923 dataset na may partikular na impormasyon sa data ng enerhiya. Ang mga set na ito ay nahahati sa ilang pangkalahatang tema sa paggamit ng enerhiya, supply ng enerhiya, at iba pang nauugnay na salik tulad ng mga patakaran, demograpiko, kapaligiran, kalakalan, tubig, impormasyong pang-ekonomiya ng ad. Para sa mga mananaliksik na interesado sa enerhiya at kung paano ito ginagamit sa iba't ibang industriya at sektor, ang KAPSARC ay isa sa mga pinakakomprehensibong mapagkukunan ng data ng enerhiya sa web.
118. Asset Macro
Ang Asset Marco ay isang site na nagbibigay ng historical financial data at macroeconomic indicators. Sinasaklaw ng data na ito ang higit sa 75,000 stock, currency, commodities, at bonds sa buong mundo. Bilang karagdagan, ang site ay may higit sa 120,000 macroeconomic indicators na magagamit ng mga user para tuklasin ang financial data ng iba't ibang bansa. Bilang karagdagan sa lahat ng data ng financial market na ito, tinatalakay din ng site ang mga diskarte sa pamumuhunan. Ang source na ito ay napaka-kakaiba dahil sa dami ng impormasyon na mahahanap.
119. Mga Serbisyo sa Web ng Pamahalaan ng US at Mga Pinagmumulan ng Data ng XML
Ang US Government Web Services at XML Data Sources ay naka-host sa isang site na tinatawag na USGovXML.com. Dito, maaaring mag-browse ang mga user sa iba't ibang XML data source at web services na ibinigay ng gobyerno ng US. Ang simpleng pagkilos na ito ng pangangalaga ay nagpapanatili sa mga web source na iyon na transparent at naa-access sa publiko. Para sa mga mananaliksik na regular na sinusubaybayan ang index na ito sa pangkalahatan, posibleng makahanap ng isang kuwento sa data kung sakaling may biglaang pagbabago sa XML data.
120. Figshare
Ang Figshare ay isang site na nagho-host ng higit sa 5,000 piraso ng siyentipikong nilalaman na magagamit para sa akademikong pananaliksik at pagsipi. Sa itaas ng impormasyon doon, ang site ay idinisenyo upang mag-alok sa mga mananaliksik ng isang lokasyon para sa mga layunin ng pag-compile, pag-upload, pag-iimbak, at pamamahala ng pananaliksik na kanilang nahanap. Ang matematika, agham pangkalusugan, inhinyero, kimika, biyolohikal na agham, at agham panlipunan ay nakalista lahat bilang mga itinatampok na kategorya. Ang site na ito ay isang mahusay na mapagkukunan para sa mga mamamahayag na naghahanap ng higit pang mga mapagkukunang pang-akademiko sa site.
121. LinkedData
Ang LinkedData ay isang site na nakatuon sa ideya ng paghahanap ng mga bagong paraan upang ikonekta ang data sa Internet na hindi pa naka-link noon. Dito, makakahanap ang mga user ng mga tutorial, gabay, at data set na magpapatuloy sa kwento. Nakatuon lahat ang mga dataset sa paksa ng pakikisangkot sa naka-link na komunidad ng data, at bukod sa naka-link na listahan ng pamimili ng data, karamihan ay ikinategorya bilang mga dereferencable na URI na mayroon man o wala ang komplementaryong format ng RDF. Upang matuto nang higit pa tungkol sa komunidad na ito, ang site na ito ay dapat makita.
122. Ang Web Miner
Ang Web Miner ay ang perpektong lugar para sa mga mananaliksik na gustong kolektahin ang lahat ng generic na data na makikita nila sa programa. Nagho-host ang site na ito ng mga halimbawang database gaya ng mga restaurant sa US, mga SWIFT code mula sa mga bangko sa buong mundo, mga istasyon ng gas sa US, mga atraksyong panturista sa Amerika, at mga Google Play app kasama ng iba pang malalaking listahan. Kung wala nang iba, isa itong site na magpapadali at magpapabilis para sa mga mamamahayag na suriin at matuklasan ang napakalaking dami ng data sa mas kaunting oras.
123. Data Hub
Ipinagmamalaki ng Data Hub ang sarili sa pagiging isang lugar kung saan makakahanap at makakapag-publish ng data ang mga user nang mabilis at mahusay hangga't maaari. Ang site mismo ay nagho-host ng ilang set ng data. Ang House Price Index (Case-Shiller), ang buwanang presyo ng ginto, at ang Kasalukuyang Trend sa Atmospheric Carbon Dioxide ay ang tatlong pinakasikat. Bilang karagdagan sa data, nagho-host din ang site ng ilang mga tutorial na madadaanan ng mga user upang matuto nang higit pa tungkol sa pag-navigate sa iba't ibang uri ng data na magagamit.
124. Enigma Public
Sa site nito, tinawag ng Enigma Public ang sarili bilang "ang pinakamalawak na koleksyon ng pampublikong data" na available sa web. Ang mga dataset ay nabibilang sa isa sa apat na malawak na kategorya sa FOIA, Essentials, Newsworthy, at Under the Radar. Ang ilan sa mga data sa site na ito ay kinabibilangan ng mga suweldo ng empleyado ng White House at Active Federal Firearm Licenses. Pagkatapos gumawa ng isang libreng account, maa-access ng mga user ang alinman sa mga kategorya ng data na naroroon para sa pagtingin.
125. Yahoo
Karamihan sa mga gumagamit ng web ay pamilyar sa pangalang Yahoo dahil sa mga katulad ng Yahoo! Balita at Yahoo! Pananalapi sa maraming online na ari-arian ng kumpanya. Ang interes sa mga mananaliksik at mamamahayag, ay ang katotohanan na ang Yahoo ay nagho-host din ng napakaraming dataset kabilang ang Yahoo! Mga Rating ng Gumagamit ng Musika sa Mga Kanta na may Artist, Album, at Genre Meta Information, v. 1.0 at ang Yahoo! Mga Rating ng Gumagamit ng Mga Pelikula at Impormasyon sa Naglalarawang Nilalaman, v.1.0 upang pangalanan ang dalawa. Ang mga mamamahayag na naghahanap ng mga bagong istatistika ay hindi maaaring magkamali sa pinagmulang ito.
126. 1000 Genome
Ang 1000 Genomes ay tahanan ng isang proyekto na may parehong pangalan na nagmula 2008 hanggang 2015. Ang layunin ng proyekto ay hanapin ang bawat genetic variation na maaaring mangyari sa hindi bababa sa 1% ng mga populasyon na pinag-aaralan. Kasama ang mga publikasyong naganap dahil sa proyektong ito, mayroon ding napakalaking dataset na may kasamang magkakahiwalay na database ng mga variant na cell, raw sequence file, at sample availability. Maaaring i-browse o i-download ang data na ito.
127. CBOE
Ang CBOE ay isang futures exchange na pangunahing nakatuon sa volatility futures. Sa partikular, ang site ay nagtatampok ng maraming materyal tungkol sa mga futures na itinampok sa trademark na Volatility Index ng site. Ang site ay nagho-host ng data ng merkado ng lahat ng uri kabilang ang makasaysayang data, pang-araw-araw na istatistika ng merkado, at VX Futures Daily Settlement Prices. Para sa mga mamamahayag na naghahanap ng kalidad ng data ng merkado, ang CBOE ay isang site na maaaring magbigay ng impormasyong iyon sa isang format na madaling sundin at maunawaan.
128. St. Louis Fed
Ang Federal Reserve Bank of St. Louis ay isa sa, kung hindi man ang pinakamahalagang sentro ng pananalapi sa rehiyon nito. Sa website, maaaring bumasang mabuti ng mga mananaliksik ang mga working paper, data ng ekonomiya, publikasyon, at serbisyo ng impormasyon nang direkta. Sa madaling salita, walang kakulangan ng impormasyon sa kasalukuyan at nakaraang pag-iisip ng St. Louis Fed sa mga tuntunin ng patakaran pati na rin ang kakayahang suriin ang pagiging epektibo ng St. Louis Federal Reserve Bank. Para sa mga mamamahayag sa negosyo, pananalapi, at pang-ekonomiya, ito ay isang nangungunang mapagkukunan para sa impormasyon.
129. OANDA
Ang OANDA ay isang sikat na online stock trading platform, pangunahin ang pangangalakal sa mga CFD at Foreign Exchange. Sa itaas ng maraming mga tampok na idinagdag sa mangangalakal na may layuning makaakit ng mga online na mangangalakal, nagho-host din ang OANDA ng maraming data ng mga makasaysayang rate pati na rin ang makasaysayang impormasyon sa currency converter sa site. Kasama ng lahat ng data na ito, nag-aalok din ang site ng impormasyon na may mga diskarte sa pamumuhunan kasama ng balita at pagsusuri sa merkado. Hindi na kailangan ang isang account para ma-access ang karamihan sa data na ito.
130. ABS
Ang Australian Bureau of Statistics, o ABS, hindi katulad ng American counterpart nito, ay nag-aalok ng layunin ng data, pang-ekonomiyang impormasyon, at pananaliksik sa isang malawak na hanay ng mga paksa na nauugnay sa bansa. Direkta sa site mismo, maaaring maghanap ang mga mananaliksik ng istatistikal na data sa mga tagapagpahiwatig ng negosyo, pangangalaga sa kalusugan, pabahay, pananalapi, International Trade, pabahay, kalusugan ng isip, pati na rin ang mga index ng presyo at inflation. Ang mga mamamahayag ay maaaring magpatakbo ng mga paghahanap upang makahanap ng mas lumang mga survey at impormasyon na maaari ring pagbukud-bukurin ang impormasyon ayon sa rehiyon.
131. Database ng London
Orihinal na inisip at pinamamahalaan ng Greater London Authority, ang London Database ay ang pagtatangka ng London na gawing mas naa-access ng publiko ang data ng London. Ang pangwakas na layunin ay bigyan ang mga tao ng access sa impormasyong ito habang hinihikayat silang gamitin ito nang libre sa anumang paraan na gusto nila. Sa website na ito, maaaring maghanap ng data ang mga user ayon sa mga paksa tulad ng Sining at Kultura, Krimen at Kaligtasan ng Komunidad, Edukasyon, at Kalusugan. Ang mga mamamahayag na interesado sa ganitong uri ng data ay maaari na ngayong makakuha ng direkta mula sa lokal na pamahalaan.
132. Stats NZ
Ang pamahalaan ng New Zealand ay nagho-host ng isang tonelada ng mga istatistika at data para sa mga mananaliksik na humukay at suriin sa site na ito. Maaaring salain ang impormasyong ito gamit ang search bar sa itaas, sa pamamagitan ng pag-filter para sa lokasyon at rehiyon, pati na rin ayon sa paksa. Kabilang sa ilan sa mga paksa ang mga economic indicator, kalusugan, kita at trabaho, mga sektor ng industriya, kapaligiran, at negosyo. Sa pagitan ng mga karagdagang mapagkukunan ng balita at mga release na nagha-highlight sa iba't ibang mga natuklasan at istatistika, ang mga mamamahayag ay magbubunyag ng lahat ng uri ng mga istatistika na partikular sa New Zealand sa pamamagitan ng site na ito.
133. Kawanihan ng Meterolohiya ng Pamahalaang Australia
Pinapatakbo at pinamamahalaan sa huli ng Gobyerno ng Australia, ang website ng Australian Bureau of Meterology ay nagtatampok ng impormasyon sa lagay ng panahon na nauugnay sa iba't ibang lungsod at rehiyon ng Australia. Ayon sa site, ang ahensyang ito ay itinatag bilang isang paraan ng pagtulong sa mga Australyano na makayanan ang klima sa kanilang paligid sa pamamagitan ng kumbinasyon ng mga babala at payo. Dito makakahanap ang mga mananaliksik ng mga pana-panahong pananaw, pag-iimbak ng tubig, mga pagtataya sa pag-ulan, pagkakaiba-iba ng klima, at mga pana-panahong pagtataya sa daloy ng daloy. Sa site na ito makikita mo ang tumpak at kagalang-galang na saklaw sa panahon ng Australia.
134. GroupLens
Ang site na ito ay nasa web sa kagandahang-loob ng GroupLens ng Departamento ng Computer Science at Engineering ng Unibersidad ng Minnesota. Nag-aalok ang site ng mga publikasyon pati na rin ang mga dataset para sa mga layunin ng pananaliksik. Mayroong kabuuang humigit-kumulang anim na dataset. Sa mga pinangalanang hanay, magkakaroon ng iilan na may pamagat na Book-Crossing, MovieLens, at HetRec 2011. Sa madaling sabi, ito ay isang kapaki-pakinabang na mapagkukunan para sa mga mamamahayag na naghahangad na mas maunawaan kung paano gamitin ang ibinigay na data.
135. KD Nuggets
Ang KD Nuggets ay isang site na pangunahing nakatuon sa pagbibigay sa mga tao ng data science, business analytics, machine learning, at data mining. Mayroong isang page sa site na mayroong kumpletong listahan ng mga dataset na ginagamit ng mga tao para gumawa ng higit pang pag-explore ng data mining at malaking data na may mga dataset tulad ng Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett, at Datamob na lahat ay naka-link. Ito ay isang kamangha-manghang mapagkukunan para sa mga mamamahayag na mas gustong magkaroon ng lahat ng impormasyon sa isang pahina.
137. Microsoft
Lahat ng gumagamit ng PC o laptop ay malamang na nakarinig ng Microsoft kahit na sa pagdaan. Kapansin-pansin, bukod sa mga PC, laptop, at software, nagho-host din ang Microsoft ng maraming pananaliksik at publikasyon. Kabilang dito ang mga pambihirang tagumpay tulad ng pagpupursige ng kumpanya na lumikha ng mga literate machine gayundin ang cloud-based na data science. Mayroon ding karagdagang impormasyon sa mga tool na ginagawa ng Microsoft tulad ng Visual Studio Code Tools at ang mga development sa AI na kinakatawan ng mga ito.
138. RDataMining
Eksaktong tulad ng sinasabi nito sa lata, ang R Datamining ay isang mapagkukunan sa R at datamining. Ang site ay nagbibigay ng maraming halimbawa at mga dokumento na nagbibigay ng isang malalim na pananaw sa data mining at data mining kasama ang R. Bilang karagdagan, mayroon ding mga link sa mga kurso sa pagsasanay tulad ng maikling kurso na inaalok ng Unibersidad ng Canberra. Kabilang dito ang mga link sa mga libreng dataset at presentasyon pati na rin ang mga dataset na sumasaklaw sa mga paksa tulad ng data ng eroplano, airline, at ruta pati na rin ang mga link sa site tulad ng GeoDa.
139. Collaborative na Pananaliksik sa Computational Neuroscience - Pagbabahagi ng data
Ang Collaborative Research sa Computational Neuroscience, na kilala rin bilang CRCN, ay may ilang mga dataset na maaaring ma-access sa pamamagitan ng kanilang site. Ang mga dataset ay ikinategorya ng iba't ibang bahagi ng utak tulad ng visual cortex, hippocampus, motor cortex, avian, paggalaw ng mata, at aplysia bilang ilan lamang sa mga halimbawa. Kasama rin sa mga folder na ito ang mga hamon, tool, simulation, at pamamaraan. Ang kakayahang ibahagi ang data na ito ay ginagawa itong mas mahusay na mapagkukunan upang magamit para sa pananaliksik.
140. Archive ng Protein Data Bank
Ayon sa website nito, ang archive ng Protein Data Bank ay naging pangunahing mapagkukunan sa mga nucleic acid, ang 3d na istruktura ng mga protina, at kumplikadong mga asembliya mula noong 1971. Nabuo na may tahasang misyon na panatilihin ang impormasyong ito sa pampublikong domain, ang mga mananaliksik ay maaaring pumunta dito upang tingnan ang pagpapatunay mga ulat at diksyunaryo ng data online. Mayroon ding mga paglago ng data at mga istatistika ng paggamit na magagamit para sa web-based na pag-uuri at pagsusuri pati na rin para sa pag-download. Pinakamaganda sa lahat, ang site ay palaging nagdaragdag ng bagong impormasyon.
141. Ang PubChem Project
Ang PubChem bilang isang opisyal na proyekto ay idinisenyo para sa layunin ng pagpapaalam sa publiko tungkol sa kung ano ang magagawa ng maliliit na molekula mula sa isang biyolohikal na pananaw. Ang site ay naka-link sa pamamagitan ng tatlong database kabilang ang PubChem Compound, PubChem Substance, at PubChem BioAssay. Bilang karagdagan, ginagawang posible ng site na maghanap para sa mga pagkakatulad sa pagitan ng iba't ibang mga protina. Para sa mga mananaliksik na dinadala ang kanilang pagsusuri ng data sa susunod na antas, nag-aalok din ang site ng libreng coding at mga tip.
142. Medikal ng Coremine
Ang Coremine Medical ay isang napakahalagang mapagkukunan para sa sinumang naghahanap ng impormasyon sa biology, kalusugan, at gamot. Ngayon na ang biomedical text mining na kakayahan ng PubGene ay nai-roll sa kasalukuyan nitong anyo, ang Coremine ay isa rin sa mga pinaka-flexible na mapagkukunan ng biomedical na impormasyon sa paligid. Ang site na ito ay magpapakita ng mga link sa pagitan ng mga konsepto at ideya sa isang visual na nakakaengganyo, madaling maunawaan na format na maaaring hindi napansin kung hindi man. Ito ay madaling isa sa mga pinakakomprehensibong biomedical data source na magagamit sa mga mamamahayag.
143. Tu Tiempo
Ang Tu Tiempo ay isang hindi kapani-paniwalang mapagkukunan ng data ng lagay ng panahon at klima para sa bawat bansa sa mundo. Gamit ang mapagkukunang ito, madaling makahanap ng taunang, buwanan, at pang-araw-araw na mga average para sa halos bawat lungsod at rehiyon sa mundo. Bilang karagdagan, ang mga gumagamit ay maaari ring maghanap sa database ng higit sa 115 milyong mga talaan na puno ng makasaysayang data na maaaring hanapin ng sinumang tao. Depende sa rehiyong hinahanap, posibleng makahanap ng data na mula pa noong 1929.
144. Kumplikadong Mga Mapagkukunan ng Network
Ito ay isang site na nagbibigay ng access sa medyo kaunting data na unang ginamit sa mga eksperimento na nakabatay sa computer nito. Ang buong listahan ng mga dataset na naglilista ng mga uri ng data kabilang ang mga news graph, biological graph, citation graph, collaboration graph, engineered graph, at semantic graph. Nagli-link din ang page sa isang listahan ng mga source na naglalaman ng maraming impormasyon gaya ng dataset na nagsuri ng humigit-kumulang 3 milyong patent sa US. Ipinagmamalaki din ng page ang isang kahanga-hangang compilation ng mga dataset ng Complex Network.
145. Scopus
Ang Scopus ay isang tool na nagbibigay-daan sa mga indibidwal na mabilis at madaling makahanap ng pananaliksik at mga akademikong pagsipi. Ang site ay nag-aalok ng isang hindi kapani-paniwalang malawak na database ng pananaliksik na naganap sa buong mundo sa isang bilang ng mga larangan na kinabibilangan ng mga sektor tulad ng medisina, teknolohiya, agham panlipunan, at sining at humanidad. Gamitin ang Scopus upang makuha ang akademikong pinagmulan na maaaring nalampasan. Pagkatapos ng lahat, sa maraming mga lupon, ang kalidad ng isang akademikong mapagkukunan ay maaaring halos kasinghalaga ng impormasyon na ibinibigay nito.
146. Stanford
Ang reputasyon ng Stanford bilang isang prestihiyosong institusyong pang-akademiko ay hindi nangyari nang biglaan. Ang kahusayan ay makikita sa mga kursong nauugnay sa programming. Nagho-host din ang site ng ilang dataset na may kasamang mga detalye gaya ng impormasyon sa social network. May mga dataset na nakasentro sa mga social circle sa Facebook, Wikipedia admin request, Twitter social circles, at Google +. Ang mga network ng komunikasyon at ang Amazon Product Network ay mayroon ding sariling mga dataset.
Ang Department of Information Sciences ng Unibersidad ng Milano ay nagpapatakbo at nagpapatakbo ng isang web page na kilala bilang Laboratory for Web Algorithms. Ang site na ito ay tahanan ng maraming dataset na naroroon para sa paggalugad. Kabilang dito ang mga graph na may kaugnayan sa mga social network, mga graph sa Facebook, mga snapshot mula sa proyekto ng DELIS, at isang maikling listahan ng iba't ibang data. Ang impormasyong makukuha rito ay maaaring matingnan online at ma-download kung pipiliin, na ginagawa itong isa sa mga pinaka-naa-access na dataset ng uri nito sa web.
148. Imbakan ng Data ng UCI Network
Ang UCI Network Data Repository ay isang site na nakatuon sa pagkuha ng siyentipikong diskarte sa pag-aaral ng mga network. Sa pahina ng mga mapagkukunan, makakahanap ang mga mananaliksik ng mga link sa mga direktoryo ng dataset na pinili ng mga organisasyon at grupo ng pananaliksik pati na rin ng mga indibidwal. Mayroon din itong koleksyon ng mga dataset na karaniwang gagamitin para sa pagsusuri sa social media. Ang mga naghuhukay sa data ay nalulugod na malaman na ang mga set na ito ay magagamit din para sa pag-download.
149. CAIDA
Ang CAIDA, o ang Center for Applied Internet Data Analysis, ay nangongolekta ng malawak na hanay ng data mula sa iba't ibang lokasyon, kadalasan sa tulong ng iba't ibang organisasyon at indibidwal. May mga dataset na naka-host sa site na ito tulad ng AS Relationships, DDOS Attacks, Telescope at mga kaugnay nito kasama ng iba pang data. Kasama sa mga kategorya ang trapiko, topology, seguridad, worm summary, at traffic summary statistics. Ang mga dataset ay maaaring mangailangan ng paghiling ng access, ngunit marami, kung hindi man karamihan, ay pampubliko.
150. Crawdad
Ang Crawdad, o ang Community Resource para sa Pag-archive ng Wireless na Data Sa Dartmouth, ay natatangi dahil sa pagtutok nito sa pagbibigay ng wireless na data sa mga mananaliksik at iba pa na maaaring may interes sa paksa. Nag-aalok ang site ng isang bilang ng mga tool pati na rin ang pag-access sa maraming mga dataset. Kabilang sa mga nakalistang set ay ang mga tinutukoy sa Educational Use, Bit Error Characterization, Network Diagnosis, Opportunistic Connectivity, Location-Aware Computing, at higit pa upang piliin. Mapapahalagahan ng mga mananaliksik ang mapagkukunang ito kung mas sumisid sila dito.
151. US Energy Information Administration
Kadalasang tinutukoy bilang EIA, ang US Energy Information Administration ay nasa negosyo ng pagbibigay ng taunang data ng utility ng kuryente sa publiko. Ang impormasyon sa data na ito ay sumasaklaw sa mga stock ng fossil fuel, pagkonsumo ng gasolina, buwanan at taunang impormasyon sa pagbuo ng kuryente, at data ng kapaligiran bukod sa iba pang mga opsyon. Ang data ay naroroon at magagamit para sa pagsusuri mula sa mga taong 2001 hanggang 2017. Ang kailangan lang gawin ng mga mananaliksik ay mag-navigate sa site at mag-download ng impormasyon.
152. British Oceanographic Data
Pinondohan ng National Environment Research Council, ang British Oceanographic Data ay isa sa mga pinakanaa-access na mapagkukunan ng data ng dagat sa Internet. Sa isang malawak na database na humipo sa mga agos, mga profile ng CTD, data sa antas ng dagat sa internasyonal, mga agos, at kahit na makasaysayang data ng recorder ng pang-ibaba ng presyon. Bilang karagdagan, may mga dataset na makikita sa Published Data Library na nag-aalok ng karagdagang access sa catalogue. Ito ay malamang na isa sa pinakamalawak na mapagkukunan ng impormasyon sa dagat na magagamit online.
153. Makatotohanan
Nagbibigay ang Factual ng data ng lokasyon para sa advertising at para sa paggamit sa mga mobile platform. Ang partikular na interes ng mga mananaliksik ay ang mga tool ng developer na kinabibilangan ng Engine Mobile SDK at ang buong propesyonal at mga aplikasyon sa pananaliksik ng Observation Graph pati na rin ang Local Validation Stack. Sa isang website na moniker na binibigyang-diin ang hilig ng kumpanya para sa pagkuha ng data sa buong mundo at paghahanap ng mga bagong paraan upang ilagay ito sa konteksto, ang Factual ay may malinaw na pangako sa data at paghahanap ng mga bago at hindi karaniwan na mga pagkakataon na gamitin ito.
154. Global Administrative Areas
Ang Global Administrative Areas ay isang geodatabase na nagpapakita kung saan matatagpuan ang iba't ibang administratibong lugar sa mundo. Ang data na nakalap mula sa ganitong uri ng database ay karaniwang ginagamit sa mga geographic na sistema ng impormasyon. Kabilang dito ang mga bansa at higit na nahahati sa mga lalawigan, county, at mga departamento bukod sa iba pa. Ang magandang balita para sa mga mamamahayag ay ang lahat ng data na ito ay magagamit nang libre at maaari ding gamitin para sa akademiko at pangkalahatang di-komersyal na paggamit.
155. Geonames
Ang Geonames ay isang site na tahanan ng isang heograpikal na database na may milyun-milyong mga entry, natatanging tampok, at mga alternatibong pangalan. Nag-aalok ng parehong opsyon sa pag-export at pag-access sa pamamagitan ng iba't ibang serbisyo sa web, ito ay isang database na nagpoproseso ng humigit-kumulang 150 milyong kahilingan bawat araw. Salamat sa mga kakayahan ng wiki ng database, nagagawa ng mga user ang mga pagsasaayos at pagbabago sa mga entry sa database nang madali. Ito ay isang mahusay na mapagkukunan para sa multi-language na mga kakayahan sa pagho-host lamang.
156. Natural Earth Data
Ang Natural Earth Data ay isang dataset ng mapa na available sa pampublikong domain at puno ng impormasyong idinisenyo para gamitin sa software sa paggawa ng mapa para sa paglikha ng mga state of the art na mapa. Ang mga visual ng huling produkto ay maayos at maayos at ang data ay magagamit kaagad. Kasama sa dataset na ito ang pagkakaroon ng intelligence data at iba't ibang kultural, raster, at physical vector data na tema. Orihinal na ginawa nang nasa isip ang mga pangangailangan at kagustuhan ng mga cartographer, kapaki-pakinabang ang dataset na ito sa sinumang may interes sa heograpiya.
157. Mapa ng Opensstreet
Ang Openstreet Map ay hindi gaanong isang website at higit na isang pakikipagtulungan sa pagitan ng mga user na nagbibigay na ngayon ng mga serbisyo sa pagmamapa sa mga app, site, at iba't ibang hardware device. Nakakakuha ang site na ito ng bagong data kapag nagpasok ang mga user ng impormasyon sa mga hindi gaanong kilalang landmark gaya ng mga istasyon ng tren, kalsada, at mga trail. Ang buong dataset ay magagamit nang walang bayad sa site at maaaring ma-download nang buo o bahagi. Para sa mga nagpasyang gumawa ng bahagyang pag-download ng data, posible ring mag-download ayon sa rehiyon.
158. Lungsod ng Chicago
Ang Lungsod ng Chicago ay tahanan ng championship na Bulls ni Michael Jordan at ang sarili nitong natatanging istilo ng pizza, at mayroon din itong sariling portal ng buong data. Ang mga kategorya ng dataset ay sumasaklaw sa iba't ibang paksa na kinabibilangan ng Administrasyon at Pananalapi, Etika, Kalusugan at Serbisyong Pantao, Mga Parke at Libangan, Kaligtasan ng Pampubliko, at Makasaysayang Pagpapanatili. Sa madaling salita, ang portal ng data ng Lungsod ng Chicago ay nagho-host ng halos anumang bagay na magiging interesante sa mga mananaliksik, mga gumagawa ng patakaran, at mga lokal na mamamahayag.
159. CKAN
Ang CKAN ay mahalagang online na tahanan ng proyekto ng bukas na data ng Lungsod ng Glasgow. Ang site na ito ay may mga dataset sa maraming paksa na kapaki-pakinabang para sa mga negosyante, gumagawa ng patakaran, akademikong mananaliksik, at mga developer ng app upang magamit. Sa 360 na dataset na naka-host dito, ang ilan ay nauugnay sa pamamahala ng lungsod tulad ng stock ng bahay ayon sa dataset ng panunungkulan habang ang iba tulad ng cycling dataset ay partikular na interesado sa mga lokal na residente. Mayroong lahat ng uri ng impormasyon dito para sa mga mamamahayag na nagko-cover ng mas lokal na beat.
160. Pamahalaan ng India
Ang Gobyerno ng India ay may website na sumasaklaw sa analytics at mga mapagkukunan ng data sa bersyon nito ng Open Data Project. Sa kasalukuyan, may humigit-kumulang 137,940 na mapagkukunan na natingnan nang milyun-milyong beses sa site. Mayroong karamihan sa mga file na ito ay magagamit din para sa pag-download sa site. Naghahanap man ng mga numero sa badyet ng gobyerno o naghahanap ng mga dataset na tumutugon sa kalusugan at kapakanan ng pamilya, malamang na ang site na ito ay may mga mapagkukunang maiaalok.
161. Stats SA
Ang site na ito ay puno ng up-to-date na mga istatistika, publikasyon, at data na nakalap ng pamahalaan ng South Africa. Dito malalaman ng mga mananaliksik ang impormasyon sa lahat mula sa mga survey sa pagkain at inumin hanggang sa mga economic indicator, istatistika ng trabaho, bilang ng populasyon at mahahalagang istatistika ng kalusugan. Posibleng hanapin ang mga numero ayon sa lungsod, tema, at indicator depende sa kung ano ang kailangan. Ang site na ito ay nagho-host ng maraming impormasyon sa census habang naglalabas din ng mga istatistikal na publikasyon, mga questionnaire, mga code at klasipikasyon, at patakaran sa pagpepresyo.
162. Pagbuo ng Patakaran at Pananaliksik
Ang site na ito ay nai-publish sa ilalim ng payong ng US Department of Housing and Development's Office of Policy Development & Research. Naglalathala ito ng malaking bilang ng mga pag-aaral ng kaso, dalawang-taunang publikasyon, at mga peryodiko nang regular bawat taon. Nag-aalok din ito ng malaking bilang ng mga dataset na magiging interesado ang mga mamamahayag sa mga renta ng Fair Market, Mga Limitasyon sa Kita, Mga Salik ng Inflation sa Pagpopondo sa Pag-renew na ilan lamang sa mga set na may access ang publiko sa site na ito.
163. Vital Net Health Data
Sa Vital Net Health Data, makakahanap ang mga mananaliksik ng maraming malalaking dataset na nauugnay sa kalusugan. Ang site na ito ay hindi gaanong nagho-host ng lahat ng mga set na ito kundi nag-aalok ng mga link sa mga set na maaaring bisitahin ng mga tao at makahanap ng impormasyon sa pamamagitan ng. Ang na-curate na listahang ito ay nagli-link sa mga mapagkukunan tulad ng CDC Wonder, Eurocat, Health Data All Star, at gayundin ang gawain ng mga organisasyong pangkawanggawa gaya ng North American Association of Central Cancer Registries. Ito ang isa sa mga pinakakomprehensibong mapagkukunan ng dataset ng kalusugan doon.
164. Analytic Bridge
Ang Analytic Bridge ay isang mapagkukunan na nakatuon sa katalinuhan sa negosyo. Dito mahahanap ng mga mananaliksik ang talakayan sa machine learning at AI, mga link sa mga webinar at kumperensya, at kahit isang tab sa paghahanap ng trabaho. Nagho-host din ang site ng Data Science Central, na bahagi ng site na nakatutok sa malaking data. Dahil sa aktibo at nakatuong komunidad nito at sa pangako nito sa pagbibigay ng balita at impormasyon, ang mga mamamahayag na may interes sa mga implikasyon ng data para sa negosyo ay naninindigan na makakuha ng maraming mula rito.
165. Archive.org
Kilala lalo na sa mga pagsisikap nitong maging isang online na pampublikong aklatan, ang archive.org ay tahanan ng maraming nai-publish na mga gawa pati na rin ang isang malaking koleksyon ng dataset. Ipinagmamalaki ng site ang mga resulta mula sa 2012 Internet Census pati na rin ang mga archive ng Dark Net Market mula 2011 hanggang 2015, at kahit isang dataset ng mga pampublikong komento sa Reddit. May mga data dump mula sa Music Brainz at isang dataset na naglalaman ng mga audio cover na larawan. Sa pagitan ng mga publikasyon at data nito, ang archive.org ay may maraming materyal na pagdadaanan ng mga mamamahayag.
166. Akademikong Torrents
Tinutukoy ng website na ito ang sarili nito bilang isang system na idinisenyo para gawing mas madali ang pagbabahagi at pag-download ng malalaking dataset. Gamit ang teknolohiya ng torrent upang pasimplehin ang pamamahagi ng data, ipinagmamalaki ng Academic Torrents ang sarili sa pagpayag sa mga mananaliksik na i-download ang lahat ng kailangan nila nang mabilis. Nagho-host din ang site ng mga papeles, kurso, at koleksyon para sa pagtingin. Ang isang mabilis na paghahanap sa pamamagitan ng mga mapagkukunang magagamit ay magbubunyag na mayroong tonelada ng mga dataset at koleksyon na magagamit para sa pag-download dito.
167. Dataverse
Ang pinakamahusay na paraan upang lapitan ang Dataverse ay isipin ito bilang isa pang uri ng library. Dito, ang mga mananaliksik ay maaaring maghanap, tumuklas, at sumipi ng data nang madali habang sabay-sabay na ginagamit ang site na ito bilang isang imbakan para sa kanilang sariling impormasyon. Ang paksang sakop ay kinabibilangan ng mga larangan tulad ng mga agham panlipunan, mga agham pang-agrikultura, medisina, kalusugan, at mga agham ng buhay, gayundin ang mga agham sa lupa at kapaligiran. Kasama sa malalaking pangalan na may mga publikasyon sa site na ito ang Gallup at ang US Department of Commerce, Bureau of Census, Geography Division.
168. UC DATA
Nagpapatakbo kasabay ng Social Science Data Lab ng UC Berkeley, ang UC Data ay ang pinakamalaking at pinakakilalang archive ng unibersidad. Nagbibigay ang site na ito ng mga handog sa mga lugar ng istatistika at data ng agham panlipunan. Sa site na ito, maa-access ng mga mananaliksik ang mga papeles, ulat, at working paper na ginawa ng mga mananaliksik ng UC Data. Sinasaklaw ng raw data ang maraming lugar ng pananaliksik na kinabibilangan ng Health Care, Welfare at Social Insurance, Demograpiko, Pagboto, at Information Technology kasama ng maraming iba pang paksa.
169. Joke Camp
Nag-aalok si Joe Kamp ng buong gabay sa paghahanap ng data ng soccer at football at mga API para sa layunin ng pagsusuri ng data. Kung susundin ng mga mananaliksik ang mga link na ibinigay sa page, mayroong open source na data na available sa pamamagitan ng GitHub pati na rin ang access sa libre at komersyal na mga API para sa layunin ng mas madaling pag-access. Dahil available ang data at coding sa isang kilalang-kilalang site tulad ng GitHub, hindi naging madali ang pagkuha ng ganitong uri ng data.
170. Sean Lahman
Sean Laham ay hindi nangangahulugang isang pangalan na naririnig ng mga tao araw-araw, ngunit ang kanyang site ay tahanan ng isa sa mga pinakakomprehensibo at malalim na mga istatistika ng batting at pitching sa Internet. Sa mga bilang na sumasaklaw sa panahon mula 1871 hanggang 2016, ang data ay literal na bumalik sa maraming siglo. Ang data ay libre upang ma-access at gamitin sa ilalim ng Creative Commons Share Alike 3.0 na lisensya at maaaring direktang i-download sa SQL at Microsoft Access upang pangalanan ang ilan. Ang mga istatistika ay maaari ding ma-download sa pamamagitan ng GitHub.
171. Retro Sheet
Ang Retro Sheet ay isa sa pinakamalawak na mapagkukunan sa Internet para sa mga istatistika at data ng baseball. Kasama sa site ang mga detalye tulad ng mga taunang roster at pagkakakilanlan ng mga umpire, manlalaro at coach. Para sa mga taon na ito ay may kaugnayan, ang data para sa all-star game ay kasama sa mga file ng kaganapan kasama ang isang hanay ng mga file ng kaganapan para sa post-season at isang maliit na file ng pagkakaiba. Ang Retro Sheet ay mayroon ding mga pagkakakilanlan para sa mga ball park para sa bawat season. Paano na para sa masusing?
Para sa mga hindi gaanong pamilyar sa programa, ang Hubway ay ang pangalan ng bike-share na nakabase sa metropolitan area ng Boston. Siyempre, ang system ay hindi nagtala at naglabas ng impormasyon sa pagkakakilanlan, ngunit ang Hubway gayunpaman ay may pangunahing impormasyon sa bawat paglalakbay na ginawa sa pagitan ng Hulyo 2011 at Setyembre 2012. Kasama rito ang mga detalye tulad ng simula at pagtatapos ng biyahe pati na rin ang ang istasyon ng pick-up upang pangalanan ang ilang mga kategorya.
173. Open Flights
Ang Open Flights ay isang database na mayroong impormasyon sa higit sa 10,000 ferry terminal, airport, at istasyon ng tren sa buong mundo. Mahahanap ng mga mananaliksik ang Excel-compatible, .csv na bersyon sa pamamagitan ng GitHub at maaari ding direktang mag-download ng data sa website. Gamit ang mapa sa homepage, posibleng makita kung aling mga partikular na lugar ang nasa listahan at ang site ay umaabot pa sa pagkakaroon ng impormasyon ng ruta na magagamit din. Maaaring makipag-ugnayan ang mga may-ari ng site para sa higit pang updated na impormasyon.
174. MLVIS
Ang MLVIS ay isang data repository na pinagsasama ang visual analytics sa data mining sa real time. Ginagawa nitong posible na tuklasin ang mas madaling maunawaan na mga pag-unawa sa data kahit na nagtatrabaho sa malalaking dataset. Ang benchmark na data at non-relational na machine data learning kasama ang iba't ibang uri ng data gaya ng attributed at heterogenous ay kabilang sa maraming feature at opsyon na available sa site na ito. Para sa karagdagang kaginhawahan ng mga gumagamit, ang impormasyong ito ay maaari ding ma-download sa isang pare-parehong format.
175. Buksan ang Pagsisimula ng Data
Ang Open Data Inception ay isang site na nag-aalok ng mga link sa higit sa 2600 data portal. Sa pamamagitan ng paggamit ng search bar sa itaas, maaaring maghanap ang mga mananaliksik ng mga portal at dataset ayon sa kategorya at ayon sa tema. Bilang karagdagan, posible ring gamitin ang site bilang isang paraan ng paghahanap ng pinaka-up-to-date na bersyon ng dataset na hinahanap. Samantalahin ang kakayahang tingnan ang mga portal ng data sa format ng listahan o sa interactive na visual na anyo at simulan ang paghahanap ng kinakailangang data.
176. OpenDataSoft
Available sa French, English, at German, ang OpenDataSoft ay isang source na nag-aalok ng access sa 480 milyong record, 4 na milyong API cell, at 9,284 na dataset. Gamit ang search bar sa gitna ng homepage, maaaring magpasok ang mga mananaliksik ng keyword o kategorya at hanapin ang pinakaangkop na dataset mula doon. Para sa mga mamamahayag, ito ay isang mas mabilis na paraan upang mahanap ang mga pinakanauugnay na dataset na kailangan upang makumpleto ang pananaliksik na pinag-uusapan. Bisitahin ang site para matuto pa.
177. Nationmaster
Ang NationMaster ay isang mapagkukunan ng ganap na pinagsama-samang data mula sa mahigit 300 bansa na naayos sa mahigit 5,000 kategorya. Sinasaklaw ng data ang mga numero na kinabibilangan ng mga numero sa porsyento ng mga pagkamatay na nairehistro, mga istatistika ng World War 2, at kahit na impormasyon sa digmaang nuklear at pagsubok. Ang mga mananaliksik ay makakahanap din ng mga talahanayan, graph, at pie chart na magbibigay-daan para sa karagdagang visualization ng data. Sa madaling salita, napakaraming paksa ang sakop na palaging may bagong mahahanap sa data.
178. Followerwonk
Ang Twitter ay matagal nang sikat na social media site para sa mga nagbabagang balita at paghahanap ng mga trending na kwento. Pinapayagan ng Followerwonk ang mga user na dalhin ang kanilang paggamit sa Twitter sa susunod na antas. Kabilang dito ang paghahanap ng mga user ng Twitter na makakakonekta, pag-aaral ng mga kasalukuyang tagasunod, at pagpaplano ng aktibidad sa Twitter para sa pinakamataas na resulta. Sa mga araw na ito, maraming mga reporter at mamamahayag sa Twitter na gumagamit ng site para sa networking at pagkuha ng mga kuwento doon. Ginagawa ng Followerwonk ang mga gumagamit ng Twitter na mas produktibo sa site.
179. Infochimps
Ang Infochimps ay isang site na nag-aalok ng cloud-based na mga serbisyo na maaaring i-scale pabalik para sa layuning masulit ang malaking data. Ito ay kapaki-pakinabang pagdating sa pag-deploy at pagsasama ng teknolohiya at application ng malaking data. Kapag naghahanap ang mga mananaliksik sa napakaraming data o sinusuri ang mga uso sa malaking data, isa itong napakahalagang mapagkukunan. Mayroon ding maraming mga puting papel at mga kaso na magagamit para sa mga mananaliksik upang tingnan sa site.
180. Naka-archive na mga istatistika ng pambansang pamahalaan
Itinatag noong 2006, Archive-Ito ay isang serbisyong ibinigay ng Internet Archive. Tinutulungan ng serbisyong ito ang mga organisasyon at negosyo na lumikha ng mga digital na koleksyon at bilang resulta, nagkaroon ito ng mga pagkakataong makipagtulungan sa mga non-profit, kolehiyo, unibersidad, at pamahalaan. Maaaring maghanap ang mga mananaliksik ng ilan sa iba't ibang archive sa site tulad ng mga website mula sa 2014 congressional candidate race, Alabama State Archives, at Canadian Government Information PLN Web Archive. Ang site na ito ay isang kayamanan ng impormasyon para sa mga masugid na mamamahayag.
181. Civic Commons
Ang Civic Commons ay may pahina na naglilista ng iba't ibang inisyatiba ng open data ng gobyerno. Itong nahahanap na listahan ng mga mapagkukunan ay inayos ayon sa bansa, lungsod, rehiyon, at kahit na binabanggit ang mga mapagkukunang ginawang available ng mga intergovernmental na organisasyon. Para sa mga mamamahayag, ang site na ito ay kumakatawan sa isang mas mabilis na paraan upang malaman kung aling mga pamahalaan ang kalahok sa Open Data Project. Nagbibigay din ang site na ito ng access sa mga piraso ng naka-localize na data na hindi nangangahulugang lalabas sa isang simpleng paghahanap sa Google.
182. Mga Pamahalaang Pandaigdig na Tagapangalaga
Ang Tagapangalaga ay isang sikat na pangalan sa mundo ng pamamahayag para sa reputasyon nito sa mga nagbabagang balita. Ang hindi gaanong napagtanto ng mga tao ay ang site ay may isang seksyon na nag-aalok ng data sa at tungkol sa mga pamahalaan sa buong mundo. May mga artikulo sa epekto ng mga bilang ng kawalan ng tirahan, talakayan sa cyber-security, at maging maalalahanin na talakayan sa papel na dapat gampanan ng data at mga istatistika sa kasalukuyang klima sa pulitika at panlipunan. Ang seksyon ng World Government ng Guardian ay may kakayahang magsimula ng talakayan at maghanap ng mga anggulo para sa mga kuwento.
183. Buksan ang Data ng Pamahalaan (Hub)
Ang site na ito ay kabilang sa isang grupo sa pamamagitan ng Open Knowledge Foundation na may layuning hikayatin at suportahan ang patuloy na pagbuo ng open government data. Dito, matutuklasan ng mga user ang mga link sa isa sa pinakamalawak na listahan ng mga bukas na katalogo ng data na magagamit. Kabilang sa mga karagdagang layunin na binanggit sa site, hinahangad din ng grupo na makahanap ng impormasyon sa patakaran, pinakamahuhusay na kagawian, at mga alituntunin din. Nagbibigay ito sa mga mamamahayag ng malawak na access sa higit pa at mas mahusay na impormasyon.
184. Bukas na Pamahalaan – France
Ang website na ito ay ang online na tahanan ng open data project na inaalok ng Gobyerno ng France. Posibleng maghukay sa data sa pamamagitan ng paghahanap sa ilalim ng mga kategorya tulad ng trabaho, agrikultura, edukasyon, paglalakbay at turismo. Ito ay data na nagbibigay-daan para sa pagbuo at pagbuo ng isang mas nuanced na pag-unawa sa kung ano talaga ang sinasabi ng data habang nag-iiwan din ng puwang para sa mga paghahambing batay sa makasaysayang impormasyon. Karaniwan, ang mga mamamahayag ay may lahat ng dahilan upang maging nasasabik tungkol sa pagdaan sa data na ito.
185. Unibersidad ng Notre Dame
Iniimbak ng site na ito ang data ng pananaliksik na makukuha sa pamamagitan ng paggamit ng SourceForge.net ng Unibersidad ng Notre Dame. Ang data ay inaalok sa pamamagitan ng relational database. Ang buwanang pagtatambak ng data ay ginagawang posible rin na magkaroon ng mas mahusay na pag-unawa sa open source software at mga application nito. Upang ma-access ang impormasyong ito, ang mga kahilingan para sa pag-access ay dapat gawin sa pamamagitan ng sulat sa pamamagitan ng email. Ang catch, gayunpaman, ay ang mga scholar at akademikong mananaliksik ay ang tanging karapat-dapat para sa pag-access sa data.
186. UFO Ulat
Ang National UFO Reporting Center ay may online na database na nagdedetalye ng mga karanasan ng mga tao sa mga hindi kilalang lumilipad na bagay. Maaaring i-streamline ng mga mananaliksik ang kanilang paghahanap sa database sa pamamagitan ng paggamit ng alinman sa apat na kategorya sa petsa, ang hugis ng UFO, ang nai-post na petsa, at maging ayon sa estado. Ang mga UFO ay kakaiba dahil hindi sila nabigo na makuha ang imahinasyon ng publiko. Kung may mga kamakailang pagkikita ng ikatlong uri na nangyayari sa malapit, ito ang lugar upang malaman kung ano ang sinasabi ng mga tao.
187. WikiLeaks
Kilala at kasumpa-sumpa sa media dahil sa mga kontrobersiya at kung ano ang ibinunyag ng mga pagtagas tungkol sa panloob na gawain ng gobyerno at iba pang sikat at makapangyarihang mga tao sa lipunan, ang WikiLeaks ay may reputasyon na nauna rito. Bagama't ang mga dump ng data ay bihirang ibinaba nang tahimik, walang sinuman ang nagtatanong sa katumpakan ng impormasyon. Para sa mga mamamahayag na naghahanap ng mga kuwento na agad na makakaakit ng interes, ang WikiLeaks ay isang napatunayang pinagmulan. Kung wala nang iba, ito ay gagawa para sa kawili-wiling pagbabasa.
188. Ang Washington Post
Ang papel ay kilala na bilang isang mahusay na mapagkukunan ng breaking news at mga piraso ng opinyon, ngunit ilang mga tao ang nakakaalam na ang Washington Post ay nagbibigay ng access sa raw data na madalas na binabanggit sa mga artikulo nito. Sa pahina ng data, mahahanap ng mga mananaliksik ang data sa mga kategorya tulad ng edukasyon, census, kalusugan at kaligtasan, transportasyon at pag-unlad, mga makasaysayang database ng World Cup, at kahit na mga numero na nauukol sa gobyerno at pulitika. Sa madaling salita, ang pagkakaroon ng access sa mga numerong ito ay nakakatulong sa mga tao na magkaroon ng mas konkretong pag-unawa sa mga isyu sa balita.
189. Data ng Klima
Ang Climate Data ay isang dataset na nagbibigay ng komprehensibong impormasyon sa global na temperatura. Sa kasalukuyang format, makikita ng mga user ang bawat mahalagang bahagi ng impormasyon sa klima sa pamamagitan ng mga grids habang nakikita rin kung ano ang mga average. Para sa mga naghahanap ng kasamang data, posible ring makakuha ng access sa parehong impormasyon para sa lupa at karagatan. Maaaring ma-download ang impormasyong ito, ngunit para sa kaginhawahan, maaari din itong direktang matingnan sa site.
Ang Protein Structure ay isang source na naglalayong suriin kung paano magagamit ang mga computer network kasabay ng biology. Nagho-host ang page ng repositoryo na may data na maaaring ma-access sa pamamagitan ng mga link na ibinigay. Ang partikular na interes para sa mga miyembro ng komunidad ng pananaliksik ay kung paano isinasama ng site ang ilang ideya tulad ng pagsusuri ng modelo at executable na biology sa pagtugis nito sa layuning ito. Para sa mga mamamahayag, ang site na ito ay sulit na tingnan upang obserbahan ang pag-unlad at suriin ang data.
191. Suriin ang Data ng Survey nang Libre
Sa tulong ng site na ito, ang mga gumagamit ay maaaring kumuha ng kurso sa pagsusuri ng data ng survey nang hindi kinakailangang magbayad para sa pribilehiyo. Suriin ang Data ng Survey nang Libre kasama ang detalyadong Talaan ng mga Nilalaman nito, kasama ang mga pamagat na pampalakasan ng mga seksyon tulad ng Maps at Art of Survey – Weighted Maintenance, Balancing Respondent Confidentiality sa Variance Estimation Precision, Structural Equation Models (SEM), at Complex Survey Data. Nag-aalok ang site ng isang mahusay na pag-refresh para sa mga umaasang humawak ng higit pang istatistikal na data sa hinaharap.
192. UCLA
Sa UCLA wiki site, ang mga mananaliksik ay makakahanap ng isang bilang ng mga dataset na magagamit para sa mga layunin ng pagpapakita. Mayroong maraming kunwa at naobserbahang data na mapagpipilian. Gamit ang mga mapagkukunang ito, posible para sa mga tao na gamitin ang mapagkukunang ito upang tumuklas ng data ng klima, data ng populasyon, data ng biomedical, data ng neuroimaging, data ng census ng US, data ng halalan, at data ng ekonomiya kasama ng maraming iba pang mga kategorya. Sa huli, ang mga dataset na ito ay isang mapagkukunan na maaaring makinabang sa paggamit ng maraming tao.
Sa pahina ng site nito, nag-aalok ang University of Toronto ng access sa mga mananaliksik sa tinatawag nitong Delve Datasets. Ang mga koleksyon ng data na ito ay bahagi ng isang mas malaking produkto na idinisenyo para sa layunin ng paggawa ng mga paghahambing sa pagitan ng mga pamamaraan ng pag-aaral. Sa huli, ang impormasyong ito ay naroroon para sa pagbuo at pagsusuri ng iba't ibang mga diskarte sa pag-aaral. Sa madaling salita, ito ay isang solidong mapagkukunan para sa mga mananaliksik na gustong mas maunawaan kung paano suriin at pangasiwaan ang mga dataset.
194. Serbisyo sa Pag-iingat ng Likas na Yaman
Ang Serbisyo sa Pag-iingat ng Likas na Yaman ay may site na nakatuon sa pagtataguyod ng konserbasyon habang nag-aalok ng impormasyon tungkol sa iba't ibang lumot, hornworts, vascular na halaman, lichen, at liverworts na nasa Estados Unidos. Ang site na ito ay nagho-host ng isang buong database ng mga halaman at mga larawan ng mga halaman na maaaring matagpuan sa site upang pumunta sa tonelada ng impormasyon. Maaaring i-download ng mga mananaliksik ang database at makahanap ng toneladang impormasyon sa mga paksa tulad ng mga alternatibong pananim. Sa totoo lang, nasa website na ito ang lahat ng kailangang malaman ng mga tao tungkol sa mga halaman.
195. Serbisyong Pananaliksik sa Agrikultura
Tulad ng maaaring hulaan mula sa pangalan ng ahensya, pinangangasiwaan ng serbisyong ito ang mga pangangailangan sa pananaliksik para sa US Department of Agriculture. Sa tuwing may natuklasang problema sa agrikultura, ito ang bahagi ng pamahalaan na malamang na tumulong sa paghahanap ng solusyon. Nagho-host ang site ng ilang dataset na maaaring direktang ma-access at ma-download. Magagamit din ng mga mamamahayag ang site na ito upang mahanap ang lahat ng pinakabagong balita kaugnay sa mga isyu na nakakaapekto sa agrikultura.
196. Cell Image Library
Nag-aalok ang site na ito ng pampublikong aklatan na nag-aalok ng mga mapagkukunan, impormasyon, at access sa mga larawan at animation na nagpapakita ng mga cell at cellular na proseso. Dinisenyo ang cell na nasa isip ang dalawahang proseso ng pananaliksik at edukasyon, ang impormasyon dito ay halos palaging may kaugnayan sa mga talakayan ng pampublikong kalusugan at sakit. Ang mga materyales ay nagmula sa isang kumbinasyon ng mga mapagkukunan kabilang ang makasaysayang at modernong mga publikasyon. Para sa isang masusing pagpapaliwanag na nagpapasimple sa mga kumplikadong biological na proseso, hindi maaaring magkamali ang mga mamamahayag sa Cell Image Library.
197. Kumpletong Genomics
Ito ang site ng isang kumpanya na isinasaalang-alang ang sarili bilang isang itinatag na bahagi ng biotech space sa lugar ng human genome sequencing. Kapansin-pansin, ginawa ng Complete Genomics ang ilan sa buong genome sequence nito na magagamit sa publiko. Sa huli, nag-aalok ito ng lahat ng uri ng mga kapaki-pakinabang na insight sa DNA at ang sequenced genome ng tao. Ang tanging kundisyon sa materyal na ito ay ang mga mananaliksik na gumagamit ng impormasyong ito ay mag-ingat na bigyan ang Complete Genomics ng mga wastong sanggunian.
198. Array Express
Ang Array Express ay isang repositoryo na nag-iimbak ng impormasyon mula sa mga resulta ng mga eksperimento sa genomics na nangangailangan ng napakalaking dami ng sequencing o pagproseso. Sa site na ito, mahahanap ng mga user ang higit sa mga resulta ng higit sa 70,000 mga eksperimento upang pumunta sa higit sa 2 milyong mga sanaysay sa loob ng maraming terabytes ng mga tindahan ng data. Mas mabuti pa, ang impormasyong ito ay libre para magamit muli para sa mga layunin ng pananaliksik. Ito ay isang mahusay na mapagkukunan para sa lahat ng pinakabagong impormasyon sa genomics at ang pag-unlad na ginagawa sa larangan.
199. I-encode
Ang Encyclopedia of DNA Elements, o ang ENCODE Consortium, ay resulta ng mga pangkat ng pananaliksik mula sa buong mundo na nagtatrabaho sa pakikipagtulungan sa isa't isa. Sa huli, ang layunin ay mag-compile ng isang listahan ng lahat ng functional na bahagi ng genome na kinabibilangan ng malapit na pagsusuri sa mga antas ng RNA, protina, mga elementong kumokontrol sa mga selula at aktibidad ng mga gene. Mayroong data na maaaring hanapin pati na rin ang isang encyclopedia na nag-aalok ng karagdagang impormasyon.
200. Ensemble Genomes
Ang Ensemble Genomes ay isang site na itinatag noong 2000 na tumatalakay sa mga genome ng mga vertebrates. Sa paglipas ng mga taon, ang mapagkukunang ito ay nagdagdag ng kasamang impormasyon sa invertebrate metazoan, mga halaman, bakterya, at fungi. Ang data sa lahat ng mga paksang ito ay mahahanap at ma-access sa pamamagitan ng pag-click sa mga link na magagamit sa site. Ang site na ito ay may mga tutorial, mga dataset sa lahat ng mga paksang sakop, at isang koleksyon ng mga dokumento upang i-browse. Ang lahat ng mga salik na ito ay gumagawa ng Ensemble Genomes na isang kamangha-manghang mapagkukunan ng data para sa mga mamamahayag.
Ang Gene Ontology ay isang site na umiiral para sa malinaw na layunin ng paghahanap ng paraan upang kumatawan sa kasalukuyang pag-unawa sa kung paano gumagana ang mga gene sa pamamagitan ng computer. Mayroon itong maraming publikasyon pati na rin ang karagdagang dokumentasyon na mababasa ng mga tao. May mga anotasyong direktang naka-host sa site. Ang magandang balita para sa mga mananaliksik na gustong masusing tingnan ang mga numero at hilaw na data ay mayroong mga file na magagamit para i-download nang direkta sa website.
202. Library of Integrated Network-based Cellular Signatures
Ang Harvard Medical School LINCS Center ay umiiral para sa layunin ng pagtulong sa komunidad ng pananaliksik at sa pangkalahatang publiko na matuto nang higit pa tungkol sa kung paano tumutugon ang mga selula ng tao kapag sila ay nababagabag ng mga droga. Gamit ang database ng HMS LINCS at ang tool sa explorer ng proyekto, makakahanap ang mga mananaliksik ng mga publikasyon at mga buod ng proyekto pati na rin ang mga pangkalahatang mapagkukunan. Magagamit din ng mga mamamahayag ang site na ito upang makuha ang lahat ng mga pinakabagong balita at impormasyon na lalabas sa pananaliksik na ito.
203. Human Genome Diversity Project
Ang Human Genome Diversity Project ay gumagawa ng maraming pag-unlad sa pamamagitan ng pagsisikap ng Stanford Human Genome Center. Ang site ay may mga sample na mayroong libu-libong sample at marker. Lumalabas na ang mga ito ay maaaring ma-download at maobserbahan at masusing pag-aralan sa pamamagitan lamang ng pagsunod sa mga link na ibinigay sa pahina. Ito ay isang mahusay na mapagkukunan para sa mga mamamahayag na gustong maunawaan ang impormasyon na nagmumula sa komunidad ng pananaliksik.
204. JCB DataViewer
Pinapayagan ng JCB DataViewer ang mga interesado sa kung ano ang sasabihin ng Journal of Cell Biology na makita ang data ng imahe na nauugnay sa mga artikulong nai-publish doon. Ang site ay may isang buong gallery na maaaring i-scroll ng mga tao upang makita ang mga materyales. Bilang karagdagan, may opsyon din ang mga manonood na makapagsagawa ng karagdagang pagsusuri ng data habang binabasa nila ang site. Sa madaling salita, ang site na ito ay perpekto para sa pag-unawa sa mga sanggunian at mga numero na nasa mga artikulo ng journal.
205. Genomic Data Commons Data Portal
Ang GDC Data Portal ay isang platform na idinisenyo upang tulungan ang mga mananaliksik at ang mga nasa larangan ng bioinformation na magsagawa ng pananaliksik sa kanser nang mas mahusay. Mayroong archive, isang API, pati na rin ang mga dokumentong magagamit para sa pagbabasa at iba pa. Ang pag-access sa site na ito ay nangangahulugan ng kakayahang makita ang parehong impormasyon na ginagamit ng mga mananaliksik ng kanser upang magsagawa ng kanilang sariling pananaliksik. Dito, mahahanap ng mga mamamahayag ang lahat ng data na hinahanap nila at pagkatapos ay ang ilan.
206. Binubuksan
Ang Opensp ay isang proyektong pinapagana ng komunidad na idinisenyo para sa layunin ng pagbabahagi ng mga genotype. Ang mga taong na-type gamit ang FamilyTreeDNA, 23andMe, o deCODEme ay maaaring mag-upload ng impormasyong iyon sa site. Ang layunin ng paghiling sa mga tao na gawin ito ay upang ang site ay makapag-focus sa pagtingin kung ang mga koneksyon ay matatagpuan sa pagitan ng mga genotype at SNP, o mga solong nucleotide polymorphism. Ang kakaibang interes ng mga mamamahayag ay ang pagkakaroon ng data na magagamit para ma-download ng mga tao at masiyahan sa pagtingin.
207. Patnubay sa landas
Ang Pathguide ay isang site na nakatuon sa pagbibigay ng impormasyon sa metabolic at signaling pathways pati na rin ang mga pakikipag-ugnayan sa pagitan ng mga protina sa antas ng molekular. Ang pahinang ito ay nagho-host ng isang listahan ng humigit-kumulang 697 mga mapagkukunan na may kaugnayan sa pangunahing paksa. Ang mga database na naka-link sa site na ito ay karaniwang libre upang ma-access. Karamihan sa mga sanggunian na ibinigay sa listahan ng mapagkukunang ito ay pangunahing nakatuon sa pakikipag-ugnayan ng protina sa protina. Ang site na ito ay isang napakahalagang mapagkukunan para sa mga mahilig sa biology.
208. RCSB PBB
Ito ay isang site na nakatuon sa pagpapaalam sa mga akademya at sa publiko sa pangkalahatan tungkol sa lahat ng bagay na nauugnay sa mga nucleic acid at protina. Nag-aalok ang RCSB Protein Data Bank ng access sa iba't ibang tool na idinisenyo upang gawing mas nauunawaan ang aspetong ito ng biology kabilang ang mga visualization tool, 3D structure viewing, at isang ganap na mahahanap na archive na maaaring ikategorya ayon sa kategorya ng organismo. Bilang karagdagan, ang site na ito ay nag-aalok ng na-update na balita sa lahat ng pinakabagong mga pag-unlad sa larangang ito.
209. Psychiatric Genomics Consortium
Ang Psychiatric Genomics Consortium ay ang resulta ng pakikipagtulungan sa pagitan ng mga investigator at mga siyentipiko mula sa buong mundo na nagtatrabaho sa pagsasaliksik tungkol sa genetic component ng mga psychiatric disorder. Sa huli, ang proyektong ito ay nakagawa ng 17 pangunahing papeles at karagdagang 31 development paper na nag-aalok ng pangalawang pagsusuri at pamamaraan na may iisang landmark na papel na lumabas sa lahat ng ito. Ang Consortium ay nag-aalok ng mga tool, pag-download, at pag-access sa mga natuklasan sa pamamagitan ng data access portal ayon sa kahilingan.
210. Chem ng Pub
Ang PubChem ay isang iginagalang na pangalan sa larangan ng medikal at biyolohikal na pananaliksik at ito ay sa napakatagal na panahon. Nag-aalok ng kakayahang maghanap ng mga istruktura pati na rin ang Compound, BioAssay, at Substance database, hindi maaaring magkamali ang mga mananaliksik sa site na ito. Bilang karagdagan, mayroong milyun-milyong mga entry na naroroon sa bawat isa sa mga database na ito. Maaaring tingnan ang impormasyong ito sa pamamagitan ng mga tool tulad ng 3D conformer tool at BioAssay tool. Ang data ay magagamit din para sa pag-download.
211. COSMIC
Gaya ng iminumungkahi ng pangalan, ang Catalog of Somatic Mutations In Cancer, o COSMIC, ay nakatuon para sa pagsasalaysay at paggalugad ng mga epekto ng somatic mutations sa cancer. Ginagawang posible ng site na maghanap sa COSMIC na nakategorya ayon sa uri ng cancer, gene, at mutation. May mga tool sa COSMIC gaya ng genome browser at cancer browser. Bilang karagdagan, mayroon ding data sa gene curation, drug resistance, genome screen, mutational signature, at gene fusion curation na available sa site para ma-download.
212. Genomics ng Drug Sensitivity sa Cancer
Ang Genomics of Drug Sensitivity in Cancer ay nakatuon sa paghahanap ng mga biomarker na makakatulong sa mga doktor na matukoy ang uri ng anticancer na gamot na mas malamang na tumugon sa mga pasyente. Maaaring gamitin ng mga mamamahayag ang mga tab ng balita upang manatiling napapanahon sa pagkakaroon ng bagong data o mga pagbabago sa site. Bilang karagdagan, mayroon ding pinagsama-samang data sa mga linya ng cell, isang database na nag-uulat ng mga tampok ng cancer, at kahit isang listahan ng mga compound na lahat ay magagamit para sa pagtingin sa site.
213. Stowers Institute of Medical Research
Ang website ng Stowers Institute for Medical Research ay nag-aalok ng mga miyembro ng pampublikong pagsasaliksik ng libreng access sa data na ginamit ng mga siyentipiko, siyentipikong pananaliksik, at genomics scientist nito para sa kanilang mga publikasyon. Para sa publiko sa pangkalahatan, nagsisikap ang institute na ituro na ang Stowers Original Data Repository ay karaniwang libre upang ma-access. Iyon ay sinabi, ang ilan sa mga pinakamalaking file sa database ay maaaring hindi direktang ma-access sa pamamagitan ng Internet nang simple at maaaring mangailangan ng mga karagdagang pagsasaayos.
214. Database ng SSBD
Ang database ng Science of Biological Dynamics ng mga system, na karaniwang tinutukoy bilang database ng SSBD para sa maikli, ay nagbibigay ng isang hanay ng mga tool at mapagkukunan na gagamitin para sa layunin ng pagsusuri ng mga mikroskopikong larawan at pagsusuri ng quantitative biological data. Ang mga larawang matatagpuan sa site na ito ay nagmula sa iba't ibang pinagmulan at may kasamang mga bagay tulad ng mga cell, single-molecule, at gene expression nuclei. Dahil ang data sa site na ito ay nakuha mula sa computational simulation at mga eksperimento, makatitiyak ang mga mamamahayag na ang impormasyon dito ay patuloy na pinipino at ina-update.
215. Pagbabahagi ng Mga Personal na Genome
Ang Personal Genome Project ay isang site na nakatuon sa paglikha ng data ng kalusugan, genome, at katangian na bukas at available sa publiko. Karamihan sa pagpapatuloy ng proyekto sa tulong ng mga indibidwal na nagboluntaryong gawing pampubliko ang kanilang genomic na impormasyon, ang site na ito ay nag-aalok ng data na natagpuan nito at matagumpay na nakuha sa publiko nang libre. Bukod sa agham, ang proyektong ito ay nag-aalok sa mga mamamahayag ng isang kawili-wiling pagtingin sa mga epekto ng paglikha ng isang pampublikong talaan ng personal na impormasyon ng genome.
216. UCSC Genome Browser
Ang USCS Genome Browser ay nagpapahintulot sa mga indibidwal na tingnan ang mga genome assemblies. Bilang karagdagan sa online na pagtingin, ang site ay nagbibigay din ng mga link na maaaring magamit upang i-download ang mga pagkakasunud-sunod at anotasyon para sa parehong genome assemblies. Ang mga link na ito ay nahahati sa mga kategorya ng tao, mammal, iba pang vertebrates, deuterostomes, insekto, nematode, iba pang genome, at iba pang mga download. Ang mga tool at direktoryo sa site na ito ay libre din para sa personal at di-komersyal na paggamit. Ang mga mamamahayag ay maaaring makinabang mula sa pagiging masinsinan at ang accessibility ng impormasyong ito.
217. UniProt
Ang Universal Protein Resource, na kilala sa pangalang UniProt, ay ang lugar na pupuntahan para sa impormasyon sa pagkakasunud-sunod ng protina at anotasyon. Batay sa impormasyong ibinigay ng tatlong database sa UniProt Reference Clusters, UniProt Knowledgebase, at UniProt Archive, ang site na ito ay nilagyan ng peptide at cluster na paghahanap kasama ng iba pang mga feature. Maaaring gamitin ng mga mamamahayag ang site na ito upang i-verify, tumuklas, at matuto nang higit pa tungkol sa mga bagong pagtuklas sa lugar ng pagkakasunud-sunod ng protina at anotasyon.
218. Data ng Actuaries Climate Index
Ang Actuaries Climate Index, na tinatawag ding ACI para sa maikling salita, ay nagbibigay sa pangkalahatang publiko at mga gumagawa ng desisyon ng impormasyon sa mga uso sa klima at ang epekto ng pagbabago ng klima sa Canada at US. Maaaring bumasang mabuti ng mga mananaliksik ang impormasyong ibinigay ng tool na pang-edukasyon na ito upang mahanap at matuklasan ang malalaking pagbabago sa dagat at panahon. Posibleng paliitin ang paghahanap ayon sa mga rehiyon at bahagi. Ang site na ito ay may mga dekada ng data sa pagtatapon nito at regular nitong ina-update ang impormasyon nito kada quarter.
219. Aviation Weather Center
Nagbibigay ang Aviation Weather Center ng tumpak, napapanahon, at napapanahon na impormasyon sa lagay ng panahon na maaasahan ng airspace system. Sa site na ito, maaaring tingnan ng mga user ang iba't ibang mga graph, pagtataya, at mga obserbasyon sa lagay ng panahon na naka-frame sa paraang mapapahalagahan ng mga aviator. Posibleng tingnan ang impormasyong ibinigay ng mga pinagmumulan ng data ng site sa real time sa pamamagitan ng alinman sa .csv o XML na output. Maaaring manipulahin at obserbahan ng mga mananaliksik ang mga raw na numero nang mas malapit sa pamamagitan ng opsyong ito sa pag-download.
220. Yunit ng Pananaliksik sa Klima
Ang website ng Climatic Research Unit ay naroroon para sa malinaw na layunin ng pagsasagawa ng pananaliksik sa mga epekto ng pagbabago ng klima sa nakaraan, pag-aaral ng mga sanhi, at paghahanap ng mga solusyon sa mga isyu ng pagbabago ng klima sa kasalukuyan. Dito, maaaring basahin ng mga tao ang mga resulta ng pananaliksik, makakakuha ng pangkalahatang-ideya ng paksa sa pamamagitan ng mga sheet ng impormasyon, magbasa ng mga publikasyon, at kahit na ma-access ang hilaw na data. Ang mga mamamahayag na naghahanap ng mga hilaw na dataset ng panahon ay mapalad sa mapagkukunang ito.
221. European Climate Assessment at Dataset
Sa website ng European Climate Assessment & Dataset, ang publiko ay makakatuklas ng impormasyon tungkol sa matinding pagbabago sa klima o lagay ng panahon. May opsyon ang mga mananaliksik na gamitin ang tool sa pagsasaliksik ng proyekto, na tinatawag na KNMI Climate Explorer, upang i-verify ang data, suriin ang mga pana-panahong pagtataya, at kahit na tingnan ang mga epekto ng El Nino bukod sa iba pang mga application. Dahil ang dataset na ito ay ina-update araw-araw, ang mga mamamahayag na gumagamit ng source na ito ang unang makakaalam tungkol sa anumang mga palatandaan ng matinding pagbabago ng klima.
222. Global Imagery Browse Services
Ang Global Imagery Browse Services, GIBS para sa madaling salita, ay isang mahalagang bahagi ng EOSDIS sa tungkulin nito bilang isang provider ng mga serbisyo ng imagery na tumutugon at batay sa mga pamantayan ng komunidad. Sa ibang paraan, pinapayagan ng GIBS ang mga regular na tao na makipag-ugnayan sa mga satellite image na kinuha mula sa halos kahit saan sa mundo sa high definition. Dahil ang EOSDIS GIBS ay ginawang available sa pamamagitan ng data ng earth science ng NASA, mas madali para sa mga mamamahayag at mananaliksik na matuto nang higit pa tungkol sa mundo sa real time.
223. Klima at Ecosystem ng Bering
Gumagana sa ilalim ng National Oceanic and Atmospheric Administration ng United States Government, sinasabi ng website na ito sa mga mamamahayag at mananaliksik ang lahat ng gusto nilang malaman tungkol sa kung paano tumutugon ang klima at ecosystem ng Bering Sea sa mga pagbabagong naganap sa Arctic. Dito, posibleng magbasa ng mga sanaysay, magsuri ng mga projection, at gamitin ang online na data tool upang makita kung paano gumagana ang iba't ibang climate index, biological, atmospheric, data ng karagatan, at wildlife sa Bering Sea.
224. NCEI
Ang NCEI, o ang National Centers for Environmental Information, ay ang huling resulta pagkatapos ng pagsasama ng tatlong data center ng National Oceanic at Atmospheric Administration. Nagho-host ang page na ito ng serye ng mga link na nahahati sa 22 kategorya na magli-link sa mga user sa iba't ibang mapagkukunan, page ng interes, at mga dataset ng klima at panahon. Malamang na makikita ng mga mamamahayag na naghahanap ng impormasyon tungkol sa klima, bagyo, ulan, at iba pang mga alalahanin sa lagay ng panahon ang hinahanap nila dito.
225. Laboratory ng Earth System Research
Ang Global Monitoring Division ng National Oceanic and Atmospheric Administration ay nagbibigay ng impormasyon sa mga pangmatagalang uso ng mga puwersa ng pagbabago ng klima sa mundo sa pamamagitan ng pagsubaybay nito sa mga pangunahing sukatan ng atmospera. Kabilang sa mga ito ang carbon monoxide, methane, nitrous oxide, at carbon dioxide bilang halimbawa. Ang mga sukatan na ito ay pagkatapos ay ginagamit upang sukatin ang mga bagay tulad ng pangmatagalang pag-ubos ng ozone, mga mapagkukunan at antas ng carbon dioxide, pati na rin ang mga lababo. Ito ay isang mapagkukunan ng pagbabago ng klima na magagamit ng mga mamamahayag.
226. WorldClim – Global Climate Data
Kailanman gusto ng isang mas mahusay na paraan sa visual na data ng klima? Ang WorldClim ay isang software provider ng libreng data na maaaring ilapat sa spatial modeling gayundin sa paggawa ng mga mapa. Ang kasalukuyang bersyon ng libreng software na ito ay maaari lamang ilapat sa kasalukuyang klima habang ang lumang bersyon ay nagbibigay-daan sa pag-access sa data ng klima mula sa nakaraan at sa kasalukuyan at hinahayaan din ang mga user na makita ang kalagayan ng mga hula sa klima sa hinaharap. Maaaring sundin lamang ng mga mamamahayag ang link at i-download ang software.
227. Laboratory ng Pagtuklas ng Kaalaman
Ang Knowledge Discovery Laboratory ay isang site na nakatuon sa pagbuo ng mga makabagong teknolohiya, ang mga pangunahing kaalaman sa machine learning, at ang paggamit ng kaalamang iyon sa mga praktikal na lugar tulad ng network science, panloloko, at pagsusuri ng siyentipikong data. Ang site ay nagho-host ng isang medyo malaking dataset sa DBLP na may 1.2 milyong mga bagay at 2.48 milyong mga link na kasama sa set. Para sa mga mananaliksik na may interes sa mga layunin ng Knowledge Discovery Laboratory, ang dataset na ito ay isang mahusay na mapagkukunan.
228. Hamon sa Pagpapatupad ng DIMACS
Ang website ng 9th Implementation Challenge ay tungkol sa pagtulong sa mga mananaliksik na matutunan kung paano lutasin ang pinakamaikling problema sa landas. Para sa mga tagalikha, ang site ay binuo na may dalawang layunin sa isip. Una, upang mahanap ang pinakamahusay na mga reproducible na solusyon. At dalawa, upang gawing madali para sa mga mananaliksik na mag-collaborate at tumuklas ng mas epektibong solusyon. Maaaring suriin ng mga mananaliksik na interesadong makita kung gaano kalaki ang pag-unlad nito sa mga papeles at mga dataset sa site.
229. Imbakan ng Network
Ang Network Repository ay isang site kung saan iniimbak ang siyentipikong data kasama ang pagdaragdag ng mga interactive na visual na tool na maaaring ma-access at masuri ng mga user. Ang site na ito ay nagtataglay ng dalawahang pagkakaiba ng pagiging pareho ang unang repositoryo ng uri nito at ang pinakamalaking isa sa web. Ang paggamit ng graphing data at intuitive, visually engaging na mga larawan, paggawa ng mga paghahambing at paghahanap ng mga bagong paraan upang ma-conteksto ang data ay mas madali. Maaaring gamitin ng mga mamamahayag ang mapagkukunang ito upang maghanap ng mga kuwento sa loob ng siyentipikong data.
230. Mga dataset ng Pajek
Ang Pajek Datasets ay isang page na nagbibigay ng dataset na tumutugon sa mga pakikipag-ugnayan sa pagitan ng mga protina na makikita sa namumuong yeast. Pagkatapos mag-alok ng maikling background na paliwanag sa epekto ng paghahanap ng mga bagong paraan ng pag-detect ng mga pakikipag-ugnayan kasama ang mga dahilan kung bakit ang kakayahang matukoy ang kahalagahan ng iba't ibang protina sa mga pakikipag-ugnayan ng protina ay mahalaga, direktang ini-link ng site ang mga manonood sa isang dataset na available para sa pag-download. Upang matuto nang higit pa, maaaring mag-click ang mga mananaliksik sa link sa ibaba upang mabasa ang papel na inilathala sa paksa.
231. Mejn Network Data
Ang site na ito ay naglalayong magbahagi ng mga link sa network data set na ginamit at pinagsama-sama ng may-ari ng web. Ang mga tema ng mga dataset ay mula sa American College football, pampulitika na blog, at mga aklat sa pulitika ng Amerika, hanggang sa mga social network, Les Miserables, at high-energy theory collaborations. Ang mga indibidwal na may interes na tuklasin ang mga ito ay magkakaroon ng maraming mga tema ng dataset ng interes na mapagpipilian. Bilang karagdagan, ang data ay malayang gamitin hangga't may mga sanggunian.
Ang Stanford GraphBase ay ang pangalan na ibinigay sa isang grupo ng mga dataset at programa ni Donald Knuth ng Stanford. Kapag ginamit nang pinagsama sa isa't isa, ang mga program at dataset na ito ay nagagawang manipulahin at bumuo ng mga graph at network. Sa site na ito, ang mga materyales na kinakailangan ay magagamit para sa pag-download sa pamamagitan ng mga link. Sa mga file na ito, mahahanap ng mga mananaliksik ang data ng marka ng football, data ng diksyunaryo, data na may kinalaman sa muling pagtatayo ng Mona Lisa, at marami pang iba.
233. Koleksyon ng SuiteSparse Matrix
Dating kilala bilang University of Florida Sparse Matrix Collection, ang SuiteSparse Matrix Collection ay isang koleksyon ng mga matrice na may totoong buhay na implikasyon. Ayon sa site, mas madalas na ginagamit ang partikular na koleksyong ito para sa numerical linear algebra sa pagbuo at pagpino ng mga kalat-kalat na matrix algorithm. May posibilidad na magustuhan ng mga user ang koleksyon dahil sa pagiging kapaki-pakinabang nito sa pagpapatakbo at pagsubok sa mga resulta ng mga eksperimento. Ang mga dataset at matrix benchmark ay magagamit upang direktang i-download sa site.
234. Mga Dataset ng Graph
Ito ay isang hanay ng mga dataset na pinaniniwalaan ng mga tagalikha ng web page na ito na may kaugnayan o nakakapag-translate nang maayos sa representasyon ng graph. Nag-aalok ang Graph Datasets ng mga dataset gaya ng data ng Predictive Toxicology Challenge, data ng IMDb, data ng mutagenesis, data ng MovieLens, collaborative na pag-filter, at data ng protina sa mga mananaliksik na gustong matutunan kung paano gamitin ang mga raw na numero. Ang mga file ay ginawang available sa pahinang ito at pangunahing magagamit upang i-download sa XML na format.
235. Big Data News
Ang Big Data News ay isang site na nakatuon sa malaking data at sa mga batayan ng data science. Ang site na ito ay tahanan ng mga pinakabagong balita at may kasamang talakayan ng malalim na pag-aaral at Artipisyal na Katalinuhan. Bilang karagdagan, ang Big Data News ay tahanan din ng napakalaking dataset na naglalaman ng kabuuang humigit-kumulang 3.5 bilyong web page. Ang lahat ng ito ay pinaghihiwalay ng mga antas na tinutukoy bilang page-level graph, subdomain-level graph, first-level subdomain graph, at pay-level-domain graph ayon sa pagkakabanggit.
236. Center for Complex Networks and Systems Research
CNetS, o ang Center for Complex Networks and Systems Research, na tumatakbo sa ilalim ng payong ng Indiana University Network Science Institute at ng School of Informatics and Computing. Ang site ay nilayon na maging isang mapagkukunan sa mga larangan ng data science, computational social science, at mga kumplikadong network at system na may impormasyon sa pagmimina at mga pattern ng trapiko online. Bilang karagdagan, nagho-host din ang CNetS ng dataset na naglalaman ng humigit-kumulang 53.5 bilyong kahilingan sa network na ginawa ng mga user ng Indiana University.
237. OONI Explorer
Ang OONI Explorer, isang bahagi ng Open Observatory of Network Interference, ay isang proyektong nakatuon sa pagbibigay ng libre at open source na software. Posible para sa mga user na gamitin ang software upang subukan ang kanilang kamay sa pagharang sa mga website at mga app sa pagmemensahe sa iba pang mga application. Ang partikular na interes ng mga taong interesado sa teknolohiyang ito, ay ang pagkakaroon ng libreng access sa raw data na nakolekta ng OONI. Ipasok lamang ang impormasyon sa OONI Explorer at makipag-ugnayan sa data mula doon.
238. Mga Hamon sa Machine Learning
Ang mga Hamon sa Machine Learning ay nakatuon sa pagsasaliksik at pagpapaunlad ng machine learning. Sa site na ito ang mga mambabasa ay makakahanap ng mga link sa software, mga libro, mga hamon sa machine learning, pati na rin ang mga abiso ng mga paparating na workshop. Nagbibigay pa nga ang site ng mga link sa mga hamon na nagbibigay-daan para sa mga pagsusumite pagkatapos ng petsa. Para sa mga mamamahayag na interesadong makita kung ang machine learning ay makakagawa ng mga gawain tulad ng financial prediction o web page classification, ito ay isang site na sulit na bisitahin.
239. DataX
Kasalukuyang nagtatrabaho sa ilalim ng payong ng CrowdANALYTIX, ang DataX ay bahagi ng makina ng isang inisyatiba na hinimok ng komunidad na ginagamit ang kapangyarihan ng kolektibo upang lumikha ng custom na Artificial Intelligence, machine learning, at Neuro-Linguistic Programming na mga application. Ang papel na ginagampanan ng DataX sa proseso ay pagpapanatili at pag-deploy na nagsisilbi naman upang gawing scalable ang mga solusyong ito. Para sa mga mamamahayag na may maraming text, video, at data na pag-uuri-uriin, ang mga bot na available sa pamamagitan ng CrowdANALYTIX at DataX ay maaaring mabawasan ang mga oras ng pananaliksik sa kalahati.
240. Hinimok na Data
Pinagsasama ng Driven Data ang crowdsourcing sa data science sa paraang halos hindi ginagawa ng ibang site. Binibigyang-diin ang papel nito sa pagbibigay ng tulong sa mga organisasyong humaharap sa iba't ibang hamon sa lipunan, ang site na ito ay nag-aalok ng tulong sa pamamagitan ng paglalagay ng malaking komunidad ng data science nito sa paggawa ng mga istatistikal na modelo na lumulutas ng mga predictive na tanong. Lumilitaw na pangunahing gumagana ang Driven Data sa mga nonprofit, ngunit ito ay potensyal na kapaki-pakinabang para sa sinumang may raw data na nangangailangan ng pagpino. Maaaring makinabang ang mga mamamahayag sa pag-iingat sa pinagmulang ito.
241. Buksan ang Big Data
Ang Dandelion API ay isang application na humahawak ng semantic text analysis para sa malaking data. Ang ibig sabihin nito para sa mga taong may data na nangangailangan ng pagproseso ay ang program na ito ay kukuha ng hindi organisadong text at hahanap ng paraan upang mailagay ito sa konteksto. Ang mga mamamahayag na nagbabasa ng maraming dokumento ay tiyak na makikinabang sa kakayahang iyon. Ang Dandelion API ay mayroon ding Open Big Data sa ilalim ng mga kategorya ng Milano, Trento, at Europe. Bagama't binabayaran ang API na ito, mayroong pang-araw-araw na dami ng text na maaaring masuri nang libre.
Nakatuon ang Earth Models sa pagbabahagi at pag-iimbak ng software at mga dataset habang nauugnay ang mga ito sa earth. Kasama sa mga tool sa pagmomodelo na binanggit sa site ang simulation software at pagpoproseso pati na rin ang virtual na data na nanghihiram nang husto mula sa mga partikular na lugar ng pag-aaral tulad ng tectonics at seismology. Ang mga mamamahayag at mananaliksik na gustong pinuhin ang kanilang kaalaman sa paksa ay maaaring gamitin ang mga publikasyon at artikulo sa site na ito upang gawin ito bago sumabak sa mga tool sa pagmomodelo at visualization.
243. Socioeconomic Data and Applications Center (SEDAC)
Ang Socioeconomic Data and Applications Center, o SEDAC, ay isa sa mga data center na nauugnay sa EOSDIS system ng NASA. Sa site na ito, makakahanap ang mga mambabasa ng mga dataset na nag-aalok ng mga numero sa pagbabago ng klima o gridded demographic na impormasyon. Ang mga dataset ay maaari ding hanapin ayon sa mga tema gaya ng Pamamahala, Agrikultura, Paggamit ng Lupa, Kalusugan, Pag-iingat, at Klima, Tubig, Remote Sensing, at Kahirapan. May mga mapa, gallery, gabay na nagbibigay ng higit na konteksto sa data, at karagdagang mga mapagkukunan at tool na maa-access din ng mga mananaliksik sa site.
244. AODN Portal
Ang AODN Portal, isang site na hawak ng Australian Ocean Data Network, ay isang site na nag-aalok ng access sa Australian climate science at marine data. Ang mga mananaliksik na nag-a-access sa impormasyong ito ay magkakaroon din ng access sa data ng IMOS at sa metadata, na isang balangkas ng pananaliksik sa maraming institusyon kabilang ang suporta ng Pamahalaang Australia. Ang mga mananaliksik na nagpasyang gamitin ang AODN Portal ay makakaasa na makatanggap ng mahusay na paghahatid ng data ng karagatan sa isang madaling gamitin na interface.
245. Planet OS
Nag-aalok ang Planet OS ng malaking data framework na may diin sa renewable energy. Dahil sa pagpili ng angkop na lugar na ito kasama ang kahusayan ng site, naging popular ito sa mga kumpanya ng enerhiya sa paghahanap ng mga bagong paraan upang mailarawan at ma-conteksto ang kanilang data. Bukod pa rito, mayroon ding tinatawag na DataHub present ang site kung saan nagho-host ito ng malaking koleksyon ng mahigit 2,000 datasets. Kasama sa mga dataset na ito ang bukas na data sa pamamagitan ng NASA at Copernicus at ang data ay madalas na ina-update sa isang regular na batayan.
246. INSTITUSYON NG SMITHSONIAN
Ang Smithsonian ay matagal nang iginagalang na pang-akademikong pangalan at pinahahalagahan sa buong mundo para sa pangako nito sa pananaliksik at kasaysayan. Sa ilang aspeto, natural lamang na ang Smithsonian ay magkakaroon ng website na nag-aalok ng ilan sa mga pinakamahusay na impormasyon sa pananaliksik sa bulkan online. Ang site ay nag-publish ng mga ulat, mga link sa pananaliksik, at mga database na may kasamang makitid na bulkan, pagsabog, paglabas, at mga paghahanap ng pagpapapangit upang sumama sa listahan at spreadsheet ng bulkan ng Holocene. Ang mga mamamahayag ay hindi na mangangailangan ng isa pang mapagkukunan sa aktibidad ng bulkan.
247. Catalog ng Lindol
Na-update at pinananatili ng US Government's Earthquake Hazards Program, ang Earthquake Catalog ay nagbibigay-daan sa mga mananaliksik na makita kung kailan at saan huling naganap ang isang lindol. Habang ang mga resulta ng paghahanap ay limitado sa 20,000, ang paghahanap ng catalog ay may kakayahang mag-filter ng mga resulta ayon sa magnitude, petsa at oras, at maging ayon sa heyograpikong rehiyon. Ang antas ng flexibility na ito ay ginagawang partikular na kapaki-pakinabang ang mapagkukunang ito para sa mga mamamahayag na nagko-cover ng isang natural na sakuna o isang lokal na lindol at naghahanap ng ilang background na impormasyon.
248. American Economic Association
Ang American Economic Association ay nagbibigay sa mga mananaliksik ng data sa macroeconomic data para sa US at iba pang mga bansa sa buong mundo. Ang site na ito ay hindi lumilitaw na gumawa ng pang-ekonomiyang data nang labis dahil ito ay gumagawa ng isang maikling listahan ng mga pinaka-maaasahan. Gayunpaman sa liwanag ng maraming mga site na nag-aalok ng pang-ekonomiyang impormasyon sa Internet, ito ay isang mapagkukunan na maaaring asahan ng mga mamamahayag na magkaroon ng kredibilidad. Pumunta lamang sa site at mag-click sa mga kategorya ng data ng ekonomiya nang naaayon.
Ang Historicalstatistics.org ay isang hindi kapani-paniwalang kapaki-pakinabang na site para sa paghahanap ng uri ng impormasyong pang-ekonomiya na nagpapakita ng isang kawili-wiling kaibahan sa kasalukuyan. Halimbawa, ang makasaysayang currency converter ng site ay nagbibigay-daan sa mga mananaliksik na malaman kung magkano ang mabibili ng isang tao na may $10 USD noong 1923 ngayon. Nagho-host din ito ng mga publikasyon at papel na nagtatanong tungkol sa mga sukatan na ginamit sa larangan ng kasaysayan ng ekonomiya kasama ang mga indeks ng presyo at impormasyon sa suplay ng pera na maaaring salain ng bansa.
250. DB Nomics
Paano kung ang lahat ng pampublikong pang-ekonomiyang data sa Internet ay maaaring ma-access at hanapin mula sa isa, solong, navigable na platform? Ang Db.nomics ay isang economic database aggregator na naglalayong gawin iyon nang eksakto. Available ang data sa mga format tulad ng HTML, JSON, at CSV at awtomatikong ina-update habang ang mga nakaraang pagbabago ay naka-archive nang naaayon. Kabilang sa mga mapagkukunang pang-ekonomiya ang Federal Reserve, ang Bureau of Economic Analysis, ang International Monetary Fund at iba pa. Ang mga mananaliksik na naghahanap ng kagalang-galang na data ng ekonomiya ay hindi maaaring magkamali sa Db.nomics.
251. Pinagsamang External Debt Hub (JEDH)
Binuo sa pamamagitan ng pinagsamang gawain ng Bank for International Settlements, Organization for Economic Cooperation and Development (OECD), International Monetary Fund, at World Bank, ginagawang accessible ng Joint External Debt Hub ang impormasyon sa data ng utang at mga international creditors at debtors. ang publiko. Ang mga mamamahayag na tumitingin sa pananalapi ng iba't ibang mga bansa at sinusubukang makakuha ng mas malalim na pag-unawa sa pandaigdigang tanawin ng pananalapi ay mahahanap ang halos lahat ng gusto nilang malaman dito.
252. International Trade Data
Kasama ang buong input ng isang nangungunang eksperto sa ekonomiya sa Jon Haveman, ang pahinang ito sa International Trade Data ay nagho-host ng data na maaaring ma-download at higit pang masuri. Kasama sa mga dataset ang data ng taripa, mga talahanayan ng Penn World, mga utility, data ng pag-import, produktibidad ng pagmamanupaktura, mga pag-uuri ng mga produkto, Mga Code ng Pagkakaiba ng Produkto ng Rauch, data ng NBER, ang survey ng daloy ng kalakal noong 1997, kalakalan at imigrasyon, at ang kapaki-pakinabang na modelo ng gravity. Ang UNIX ay ang operating system na ginamit upang i-compile ang mga ito, ngunit ang mga tala ng site na ang mga PC ay dapat magkaroon din ng access sa data.
Sa OpenCorporates ang mga mananaliksik ay may karangyaan sa paghahanap at paghahanap ng impormasyon sa isa sa pinakamalaking bukas na database ng mga kumpanya sa buong mundo. Ang impormasyong ito ay ginagamit ng iba't ibang grupo sa buong mundo tulad ng mga bangko, imbestigador, NGO, at mga mamamahayag sa pagsisikap para sa katalinuhan at impormasyon. May dagdag na benepisyo ang mga mamamahayag na ma-access ang data sa real time sa tulong ng OpenCorproates API gayundin sa pamamagitan ng maramihang core data o iba pang pangunahing dataset.
254. Ang Aming Daigdig sa Data
Ang Our World in Data ay kumukuha ng impormasyon mula sa ilang source sa iba't ibang lugar at nagpapakita ng quantified data dito. Mula sa mga numero sa partisipasyon ng kababaihan sa workforce hanggang sa impormasyon sa pangkalahatang pananaw sa katiwalian sa pampublikong sektor at hindi pagkakapantay-pantay ng kita sa buong mundo, kung ang paksa ay maaring talakayin sa mga tuntunin ng data, ang website na ito ay maaaring may entry para dito. Maaaring gamitin ng mga mamamahayag ang mapagkukunang ito upang maghanap ng mga istatistika at numero na nauugnay sa mga isyung panlipunan.
255. Science Po
Sciences Po, o bilang mas karaniwang kilala, ang Institute of Political Studies ay isang paaralan na hindi maikakaila ang impluwensya sa mga agham panlipunan. Sa kasong ito, kasama sa page ni Thierry Mayer ang mga data file na nagtatampok ng gravity at military conflicts regressions data mula sa “Make Trade Not War” pati na rin ang mga dataset sa mga potensyal sa merkado kasama ng iba pa. Ang mga mamamahayag na naghahanap upang mas maunawaan ang mga konklusyong naabot sa mga akademikong journal ay magbubukas ng maraming impormasyon habang nagba-browse sa site na ito.
256. Sentro Para sa International Data
Mula nang gawin ang kanyang debut noong 1999, ang Center for International Data ay nakatuon sa kanyang misyon ng pagkolekta, paglikha, pagpapabuti, at pamamahagi ng internasyonal na data ng ekonomiya kapwa offline at online. Sa website, ang mga mambabasa ay may access na impormasyon tulad ng data ng US Tariff, World at US imports at exports, at kahit na impormasyon mula sa Penn World Table. Dahil ang impormasyong ito ay ginawang magagamit sa publiko para sa edukasyon at pananaliksik, maaaring ma-access at magamit ng mga mamamahayag ang data na ito nang libre.
257. Observatory of Economic Complexity
Ang Observatory of Economic Complexity, na karaniwang tinutukoy bilang OEC, ay nagpapahintulot sa mga mananaliksik, mag-aaral, ekonomista, at sinumang iba pa na mailarawan ang data ng kalakalan sa internasyonal. Sa mga kapansin-pansing tema at interactive na interface nito, ang site na ito ay nagbibigay sa mga mananaliksik ng lehitimong pagkakataon na tuklasin ang impormasyon sa internasyonal na kalakalan sa mga paraang hindi pa talaga nakikita noon. Para sa mga mamamahayag na gustong makita ang data ng ekonomiya na nabubuhay habang hinahanap nila ito, ang OEC ay isang napakahalagang mapagkukunan.
258. Data ng College Scorecard
Ang mas mataas na edukasyon ay isang mainit na paksa sa maraming mga lupon na may mga mag-aaral at pamilya na parehong gustong malaman kung paano nagkakalat ang mga paaralan at kung gaano kahusay natututo ang mga mag-aaral. Sa pamamagitan ng data ng College Scorecard nito, binibigyan ng Departamento ng Edukasyon ng US ang mga tagapagturo at estudyante ng lahat ng impormasyong ito at higit pa. Saklaw ng mga numerong ito ang 1996 hanggang 2016 at kasama ang kasalukuyang data, data ng scorecard, at mga kita pagkatapos ng paaralan, at bagong impormasyon ng National Student Loan Data System. Ito ay pinagmumulan ng up-to-date na post-secondary education na dapat tiyakin ng mga mamamahayag na gagamitin.
259. Dataset ng Enerhiya ng Komersyal na Gusali
Bilang isang dataset na pangunahing tumatalakay sa enerhiya, ang COMBED ay may awtomatikong paghahabol sa pagiging natatangi. Ilagay ang katotohanan na ang data nito ay nire-renew nang maraming beses sa isang minuto habang nagmumula sa isang komersyal na gusali, at nagiging malinaw na ang dataset na ito ay isa sa isang uri. Para sa mga mamamahayag, ang impormasyong ito ay hindi kapani-paniwalang kapaki-pakinabang na magkaroon kapag naghahanda ng isang piraso sa pagkonsumo ng enerhiya. Ang pag-access sa data ng COMBED ay kasingdali ng pag-download at pagbubukas ng Excel spreadsheet.
260. DRED Dataset
Ang DRED na bahagi ng DRED Database ay kumakatawan sa Dutch Residential Energy Dataset. Gaya ng iminumungkahi ng pamagat, sinusukat at pinag-aaralan ng data na ito kung gaano karaming enerhiya ang kukunin ng isang sambahayan sa Netherlands. Ang kapaligiran, occupancy, kuryente, at pangkalahatang impormasyon ng sambahayan ay sinusubaybayan lahat sa dataset na ito mula ika-5 ng Hulyo, 2015 hanggang ika-5 ng Disyembre, 2015. Ang sinumang mamamahayag na nagsasaliksik sa pagkonsumo ng enerhiya ay makikinabang sa pagsuri sa mga raw na numerong ibinigay dito. Ang mga tagubilin para sa pag-download ng data sa CSV ay matatagpuan nang direkta sa website.
261. ECO Dataset
Ang ECO, na kumakatawan sa Electricity Consumption and Occupancy, ay isang proyektong pinapatakbo at pinapatakbo ng Distributed Systems Group. Ang saligan ng proyektong ito ay nagkaroon ng mga mananaliksik na sinusubaybayan ang mga load at natukoy ang mga occupacy sa anim na Swiss household sa loob ng 8 buwan. Nag-aalok ang site na ito ng access sa impormasyong iyon pati na rin ang mga tagubilin at link sa mga kaugnay na publikasyon. Salamat sa visually interactive na dashboard ng site, ang mga mamamahayag ay dapat na walang mga problema sa pagsasalin ng pananaliksik sa isang bagay na nakakaengganyo.
262. Indian Dataset para sa Ambient Water at Energy
Ang IAWE, na kumakatawan sa Indian Dataset para sa Ambient Water and Energy, ay nilikha na may layuning subaybayan ang paggamit ng enerhiya ng isang Bagong Dehli na tahanan na may mga sukat ng kuryente mula sa mga appliances, metro ng kuryente, at panel ng circuit. Dahil sa mga pagkawala, pagkakaiba sa supply ng tubig, packet drop, at pagbabagu-bago ng boltahe, ang iAWE ay nagkaroon ng mga problema na kakaiba sa pagsubaybay sa paggamit ng enerhiya sa India. Ito ay hindi kapani-paniwalang kapaki-pakinabang na data para sa mga mamamahayag na magkaroon kapag tinatalakay ang mga pattern ng paggamit ng enerhiya.
263. UK Domestic Appliance-Level Electricity
Ang UK Domestic Appliance-Level Electricity, o UK-DALE, ay ang pangalang ibinigay sa isang dataset na sumusubaybay at nagtatala kung gaano kalaki ang hinihingi ng kuryente sa isang grupo ng limang sambahayan. Bawat anim na segundo, sinusukat ng UK-DALE ang demand mula sa parehong pangunahing grid ng kuryente pati na rin ang mga indibidwal na appliances sa bahay. Ang mga mamamahayag na may interes na makita kung paano gumagamit ng enerhiya ang mga sambahayan sa UK, ay tiyak na magagamit para sa UK-DALE. Ang data ay naa-access at mayroong isang papel na naglalarawan sa system na magagamit para sa pagbabasa.
264. ArcGIS
Ang ArcGIS Hub ay isang platform na magagamit ng mga organisasyon at indibidwal upang makamit ang mga layunin sa pamamagitan ng mga hakbangin sa buong site. Sa mga template ng pahina, hakbang-hakbang na mga gabay, at mga halimbawang magagamit para sa pagtingin, ang site na ito ay isang mahusay na mapagkukunan para sa mga ambisyosong social movers. Samantala, ang impormasyong available sa ilalim ng tab na Open Data ay nagho-host ng daan-daang dataset sa kategoryang "Kalamidad" lamang. Kung ang mga mamamahayag ay nagsasaliksik ng data o nag-aambag nito, ang ArcGIS Hub ay kapaki-pakinabang sa maraming paraan kaysa sa isa.
265. Cambridge GIS
Ang Cambridge GIS ay ang Lungsod ng Cambridge, ang bukas na imbakan ng data ng Massachusetts. Maliban sa mga file na masyadong malaki para ma-download sa pamamagitan ng GitHub repository na ito, karamihan sa mga dataset ng lungsod ay makikita sa page na ito. Ang mga indibidwal na dataset na available dito ay kinabibilangan ng mga komersyal na distrito, easement, zoning district, resulta ng census, sementeryo, at iba pang landmark at feature na maaaring ma-quantify ng data. Ang isang mamamahayag na naghuhukay para sa lokal na impormasyon ay mahahanap ang lahat ng kanilang hinahanap at higit pa sa site na ito.
266. Geo-Wiki.org
Bilang isang mapagkukunan, ang Geo-Wiki ay isang site na nakatuon sa tinatawag nitong “citizen science movement”. Dito, hinihikayat ang mga mamamayan na subukan ang kanilang kamay sa pagsubaybay sa kapaligiran. Mahahanap ng mga mananaliksik ang pinakabagong balita sa sidebar kasama ang mga pangalan ng mga publikasyon at libreng pag-download ng dataset at software. Ang mga tool na ginagawang accessible ng site ay kinabibilangan ng mga mapa, pag-upload ng personal na data, pagpapatunay, at hackathon na maaaring ma-download sa Excel na format at mga zip file.
267. OpenStreetMap
Ang OpenStreetMap data extract ay nagmula sa OpenStreetMap project, ang patuloy na online na pagtatangka na lumikha ng mapa ng mundo sa pamamagitan ng mga pag-edit at pagsisikap ng pandaigdigang komunidad ng mga user. Upang makapagsimula sa pinagmumulan ng data na ito, ang kailangan lang gawin ng lahat ng publisher ng content ay piliin ang kanilang gustong kontinente at pagkatapos ay hanapin ang kanilang gustong bansa pagkatapos ng puntong iyon. Walang bayad para sa pag-download ng Geofabrik GmbH na ito at ang data ay ina-update araw-araw bilang pangkalahatang tuntunin.
268. HIFLD Open Data
Pinapatakbo at pinananatili ng Department of Homeland Security, HIFLD, para sa Homeland Infrastructure Foundation-Level Data, naglalagay ng geospatial na data sa pampublikong domain. Ang data na ito ay ipinamahagi para sa malinaw na layunin ng pagbibigay ng suporta at impormasyon para sa mga layunin ng pananaliksik at paghahanda sa komunidad. Maaaring ma-download ang data na ito sa Shapefile at CSV at maaari din itong tingnan sa web. Para sa mga publisher, ang HIFLD Open Data ay ginagawang mas visual at nakakaengganyo ang geospatial na data kaysa dati.
269. OpenAddresses
Dalubhasa ang OpenAddresses sa imprastraktura at koleksyon ng address. Pinapatakbo sa kalakhan sa lakas ng mga pagsisikap ng komunidad, ginagamit ng site na ito ang GitHub bilang platform ng pagpapaunlad nito. Dito, maaaring maglagay ang mga tao ng mga address sa isang mapa pagkatapos idagdag ito sa database o maaari nilang kunin ang data at simulan kaagad ang geocoding. Sa lahat ng data at mga address na bukas at nangangailangan lamang ng pagpapatungkol, ang mga regular na pag-update ng data at ang potensyal para sa pagsulong ng geocoding ay ginagawang isang napaka-interesante na proyekto ang OpenAddresses.
270. Buksan ang Data LMU
Ang Open Data LMU ay lubos na umaasa sa data mula sa OpenStreetMap upang tumulong sa pagbuo ng Fast Reverse Geocoder. Ang ibig sabihin nito ay ang application ay may kakayahang mabilis na kumuha ng lokasyon sa isang mapa at maghanap ng buong address batay sa puntong iyon. Ito ay posibleng mailapat sa mga kapitbahayan at mga county din. Ang web page na ito ay nagho-host ng isang grupo ng mga link na nauugnay sa application na kinabibilangan ng source code, mga dataset, at mga talahanayan at resolution ng paghahanap ng OpenStreetMap.
271. Pangkapaligiran na Data Explorer
Gamit ang Environmental Data Explorer, maaaring i-download at i-explore ng mga mamamahayag, mananaliksik, at mag-aaral ang mismong mga dataset na ginagamit ng United Nations Environment Program kasama ang mga kaakibat na organisasyon at kasosyo nito. Maaaring paliitin ang mga paghahanap ayon sa rehiyon at gawin gamit ang anuman o lahat ng 500 filter. Bilang karagdagan, ang mga dataset ay kinabibilangan ng mga kategorya gaya ng kalusugan, GDP, klima, mga emisyon, at tubig-tabang na maaaring direktang matingnan sa site alinman sa graph, talahanayan, o anyo ng mapa.
272. Grupo ng African Development Bank
Ang site ng African Development Bank Group ay isang unang hinto ng mamamahayag kapag naghahanap ng istatistikal na impormasyon at mga tagapagpahiwatig na nauugnay sa kontinente ng Africa. Ang mga user na nag-i-scroll sa catalog ng data ay maaaring mag-filter ng mga dataset ayon sa pinagmulan, paksa, at rehiyon. Para sa sinumang naghahanap ng mas malalim na kaalaman sa paksang nasa kamay, nag-aalok din ang site ng mga link sa isang kahanga-hangang listahan ng mga publikasyon na kinabibilangan ng mga pamagat tulad ng African Economic Outlook at ang African Statistical Yearbook.
273. Genomic Data Commons (GDC)
Ang Genomic Data Commons ng NCI ay tahanan ng isa sa mga pinaka-masusing imbakan ng data ng kanser sa web na nakatuon sa larangan ng mga pag-aaral sa genomic ng kanser. Ang portal ng data ng site na ito ay nagho-host ng libu-libong mga kaso at sumasaklaw sa 38 na uri ng sakit na dadalhin sa 39 na proyekto at libre itong ma-access. Sa mga pagsusumite ng data na pangunahing ginagawa ng mga institusyon at mananaliksik, ang katumpakan ng impormasyong ito ay ginagawa itong mapagkukunan ng data na mainam para sa mga mamamahayag na nasa kanilang bulsa sa likod.
274. Mga Database ng PhysioBank
Ginagawang available ng mga database ng PhysioBank ang physiological data sa mga indibidwal sa pamamagitan ng pampublikong domain. Ang mga database na ito ay nahahati sa dalawang malalaking kategorya sa waveform at klinikal. Kabilang sa mga subcategory ng waveform ay may mga imahe, interbeat interval database, synthetic, gait at balanse, ECG, at multi-parameter database. Kasama sa panlasa ng dalisay na impormasyong lumalabas dito ang data sa data ng vital sign sa gilid ng kama, saturation ng oxygen, at maging ang cardiovascular disease. Ang mga mamamahayag at indibidwal na nagsasaliksik sa katawan ng tao ay maaaring makahanap ng ilang impormasyon dito.
275. Database ng Saklaw ng Medicare
Ang database ng Medicare Coverage, na pinapanatili ng Centers for Medicare & Medicaid Services sa pamamagitan ng Department of Health at Human Services, ay nag-aalok sa mga mananaliksik ng ganap na access sa isang toneladang impormasyon sa mga serbisyong medikal. Mayroong impormasyon tungkol sa mga malalang kondisyon, paggasta sa gamot, mga electronic na klinikal na template, sistema ng pangongolekta ng utang, at mga gawad ng pananaliksik at pagpapakita upang basahin ito. Para sa data na kinuha nang direkta mula sa pinagmulan, ito ang pinaka masinsinang at komprehensibong site ng uri nito online.
Nilalaman mula sa aming mga kasosyo
276. Buksan ang Data ng Mga Pagbabayad
Kapag ang karamihan sa mga tao ay pumunta sa doktor, kadalasan ay hindi sila umuupo upang isipin kung ang kanilang doktor sa pangunahing pangangalaga ay nakikinabang sa pananalapi pagkatapos makipagtulungan sa mga tagagawa ng pangangalagang pangkalusugan. Ang Open Payments ay nagpapaalam sa publiko tungkol sa anumang mga pagkain, pananaliksik, regalo, bayad sa pagsasalita, at mga gastos sa paglalakbay na natanggap ng doktor o ospital mula sa mga kumpanya. Ang mga mamamahayag na naghahanap ng isang mahirap na kuwento ay maaaring gamitin ang data explorer upang tingnan ang impormasyon o mag-click sa tab upang direktang i-download ang data.
277. FlickrLogos
Ito ay bahagyang nakasulat sa pangalan, ngunit ang FlickrLogos ay tumutukoy sa isang dataset na binubuo ng mga logo ng kumpanya na nakuhanan ng larawan sa iba't ibang mga posisyon. Pinapanatili ng Multimedia Computing at Computer Vision Lab ng Augsburg University, ang koleksyong ito ay orihinal na pinagsama-sama sa layunin ng pagsasanay sa mga computer upang makilala ang logo at teksto. Upang manatiling nakasubaybay sa anumang pag-unlad na ginawa sa karapat-dapat na balitang program na ito, hindi makakasamang i-download ang dataset na ito at tingnan kung tungkol saan ito.
278. ImageNet
Ang ImageNet ay isang database na puno ng mga larawan na inayos ng WordNet. May mga taunang hamon sa site na maaaring matingnan kahit na pagkatapos ng pagsasara at nakatutok sa paglikha ng mga algorithm na kayang magsagawa ng mga tinukoy na gawain. Ang ImageNet ay tahanan din ng maraming publikasyon, pagsipi, at slide. Ang mga publisher ng content na nakatuon sa tech ay magkakaroon ng lahat ng dahilan upang gamitin ang opsyon ng explorer para magkaroon ng kahulugan ang istraktura ng WordNet pati na rin ang cloud map.
Ang dataset ng Stanford Dogs ay naglalaman ng napakaraming larawan at larawan ng iba't ibang lahi ng aso. Kasama ang 120 iba't ibang lahi ng mga aso kasama ang mahigit 20,000 indibidwal na larawan, ang database na ito na pinapagana ng ImageNet ay nagbibigay sa mga mananaliksik ng maraming larawang magagamit habang nagtuturo sa mga makina kung paano kilalanin ang bawat lahi ng aso. Sa site, maaaring i-click at basahin ang mga link sa iba't ibang publikasyong tumatalakay sa paggamit ng mga dataset upang turuan ang mga computer tungkol sa pagkilala ng larawan kasama ang pag-download ng dataset.
280. SUN Database
Ang database ng SUN ay ang site ng isang proyekto na pinagsama-sama para sa komunidad ng pananaliksik upang gumawa ng mga hakbang sa mga lugar tulad ng computer vision at graphics, data mining, machine learning, at neuroscience bukod sa iba pa. Ipinagmamalaki ang higit sa 131,000 mga imahe at halos 4,000 mga kategorya ng mga bagay sa mga index nito, ang site na ito ay komprehensibo hangga't nakukuha nito. Para sa mga publisher na interesado sa database na ito at kung ano ang nagawa ng mga mananaliksik habang ginagamit ito, isa itong data source na sulit na tuklasin.
281. Ang Oxford-IIIT Pet Dataset
Ang Oxford-IIIT Pet Dataset ay isang site na nagsisilbing pandagdag sa isang papel na na-publish sa 2012 IEEE Conference on Computer Vision and Pattern Recognition at nagho-host ng orihinal na dataset na ginamit para sa mga layunin ng papel. Ang mga larawang ito ay isinaayos sa humigit-kumulang 37 mga kategorya ng alagang hayop upang pumunta sa isa pang 200 mga larawang nauugnay sa bawat klase na kasangkot. Higit pa rito, ang data na ito ay maaaring direktang ma-download sa pamamagitan ng mga link sa web page.
282. Ang Visual Genome Dataset
Ang Visual Genome API ay ang huling resulta ng pagsusumikap na ginawa ng ilang estudyante at associate professor mula sa Stanford University. Sa ilang mga papel sa pangalan nito sa pagsisikap na lumikha ng isang API na may kakayahang suriin at ilarawan ang mga larawan, matagumpay na nasagot ng programa ang mahigit sa isang milyong tanong habang sinusuri ang higit sa 100,000 mga larawan. Kinakatawan ng API na ito ang pag-unlad sa larangan ng computer science at ang mga nauugnay na field nito at maaaring direktang ma-download ang dataset sa site.
283. Mga Mukha sa YouTube
Nakatuon ang YouTube Faces Database sa pagbuo ng solusyon sa isyu ng awtomatikong pagkilala sa mukha sa mga video. Sa kabuuan, ang dataset ay mayroong mahigit 3,000 video na kinuha mula sa YouTube ng halos 1600 indibidwal sa average na haba na humigit-kumulang 181 frame. Sa huli, ang layunin ay lumikha ng isang algorithm na may kakayahang lumikha ng mga label na tumutukoy sa taong nasa video. Ang data kasama ang impormasyon sa mga error pati na rin ang mga paraan ng paglalarawan ay magagamit lahat para sa direktang pagtingin sa site.
Ang KEEL dataset repository ay naglalaman ng dataset ng Java-based na open source software na idinisenyo upang tumulong sa iba't ibang uri ng pagtuklas ng data ng kaalaman. Ang KEEL, na kilala lamang bilang Knowledge Extraction batay sa Evolutionary Learning, ay maaaring sanayin upang matutunan kung paano magdagdag ng mga nawawalang halaga, hybrid na modelo, at istatistikal na pamamaraan para sa pagsusuri ng mga eksperimento sa ilang iba pang gawain. Ang mga pag-download ng dataset pati na rin ang kumpletong listahan ng mga algorithm na itinampok sa KEEL ay maaaring direktang ma-download mula sa site.
285. Lending Club
Ang paghahabol ng Lending Club sa katanyagan ay ang katayuan nito bilang isang peer-to-peer lender na nagbibigay-daan sa mga borrower na makatanggap ng mga pautang kahit na wala silang credit score para humiram mula sa mga tradisyunal na nagpapahiram. Kasama ang mga bagong aspeto ng kung paano gumagana ang site, nagbibigay din ito ng mga istatistika na kinabibilangan ng mga highlight ng platform, tinanggihang impormasyon sa pautang, mga numero ng pagganap ng mamumuhunan, at kahit isang diksyunaryo ng data na naglalaman ng makasaysayang data. Ang mga numerong ito ay karaniwang nagsisimula sa 2007 at maaaring ma-download sa CSV.
Ang Natural Museum of History ay itinuturing ng marami bilang isa sa mga pinakakilalang museo sa mundo, ngunit ang pag-digitize at ang kakayahang suriin ang catalog nito sa pamamagitan ng bukas na portal ng data ay malamang na maging balita sa maraming tao. Sa 91 na mga dataset na kinabibilangan ng mga koleksyon ng microfossil at fossil pati na rin ang mga talaan ng index lot kasama ng iba pang mga materyales, ang data ay bukas sa publiko at malayang i-download sa maraming format.
287. Ang Mga Vocabulary ng Getty
Perpekto ang site na ito para sa mga mamamahayag at publisher na gustong manatili sa ilang partikular na mga alituntunin sa istilo kapag naglalarawan at nagkategorya ng ilang partikular na sining, mga pangalan ng artist, arkitektura, mga materyales, at mga heyograpikong pangalan. Ang site na ito ay direktang nagli-link ng mga gumagamit sa mga kinokontrol na database ng bokabularyo na kailangang malaman ng mga mananaliksik at mga katalogo upang matugunan ang mga internasyonal na pamantayan. Dito kahit papaano, walang tatalo sa Getty Vocabularies. Maaaring galugarin ang mga dataset sa pamamagitan ng text o SPARQL at maaaring ma-download sa pamamagitan ng site.
288. CLiPS Stylometry Investigation (CSI) Corpus
Ang CLiPS Stylometry Investigation Corpus ay malamang na hindi ang iniisip ng karamihan sa mga tao kapag naririnig nila ang mga salitang CSI, ngunit ang CSI corpus ay gayunpaman ay isang dataset na binubuo ng mga review ng mag-aaral at mga sanaysay ng mag-aaral. Bukod sa mismong teksto, ang pagkakaroon ng meta-data at impormasyong naka-embed sa dokumento ay binabanggit ng site upang magkaroon ng maraming gamit. Inaalok at ipinamahagi sa ilalim ng lisensya ng Creative Commons, ang lahat ng hinihingi ng corpus kapalit ng paggamit ng dataset ay isang attribution.
289. Universal Dependencies v2
Ang Universal Dependencies v2 ay tumutukoy sa pangalawang na-update na bersyon ng proyekto ng Universal Dependencies, isang pagsisikap na bumuo ng isang treebank annotation na maaaring gamitin nang tuluy-tuloy sa ilang iba't ibang wika. Sa na-update na bersyon, makakahanap ang mga mananaliksik ng dose-dosenang UD treebanks para sa iba't ibang wika kabilang ang Afrikaans, sinaunang Greek, Japanese, Dutch, Finnish, at Chinese sa ibabaw ng English. Ang pinakabagong bersyon ng Universal Dependencies ay mahahanap at mada-download malapit sa ibaba ng web page na ito.
290. Webhose
Ang Webhose ay isang nangungunang mapagkukunan ng mga dataset na direktang kinuha mula sa mga repositoryo ng site at binuksan sa publiko. Maaaring pag-uri-uriin ng mga mananaliksik ang mga artikulo ng balita ayon sa wika na ang Arabic, French, at Dutch ay ilan lamang sa mga wika na may mga numero ng artikulo na higit sa 100,000. Bilang karagdagan, ang mga artikulo ng balita sa Ingles ay higit pang pinaghiwa-hiwalay sa mga kategorya tulad ng entertainment at sports upang sumama sa pagsusuri at mga post sa forum. Maaaring makinabang ang mga digital na publisher at mananaliksik sa pag-explore sa mga dataset na ito.
291. Data ng Wiki
Ang Wikidata ay isang underrated na mapagkukunan ng nilalaman at mga ideya para sa mga publisher at mananaliksik. Ayon sa page na ito, may ilang paraan para ma-access ang materyal sa mga dump ng data bagama't ang paggamit ng JSON ay ang pinakamalakas na inirerekomenda ng site. Magagamit at ganap na libre para sa parehong di-komersyal at komersyal na paggamit, ang lahat ng data na magagamit dito ay maaaring ma-access at ma-download nang walang bayad sa ilalim ng lisensya ng Creative Commons.
292. Mga Link ng Wiki
Maginhawang matatagpuan sa loob ng balangkas ng Google Code, ang Wiki Links ay isang open source na proyekto na naglalayong bigyan ang mga indibidwal ng access sa partikular at natatanging dataset. Sa web page na ito, mada-download ng mga mananaliksik ang mga README text, data file, at lisensya ng Creative Commons nang buo. Maraming dapat abangan ang mga publisher o karaniwang tech-oriented na indibidwal kapag tinitingnan ang napakalaking dataset na ito. Mag-navigate lang sa site, i-click, at simulan ang pag-download ng mga file.
293. Wordnet
Ang WordNet ay isang English lexicon na binubuo ng mga bahagi ng wika, adverbs, nouns, adjectives, at verbs na ikinategorya sa mga natatanging pagpapangkat na pagkatapos ay ginagamit upang ipahayag ang mga partikular na ideya. Ang resulta ay isang kapaki-pakinabang na tool na ikinakategorya ang mga salita ayon sa kung paano ginagamit ang mga ito at kung ano ang ibig sabihin ng mga ito sa halip na kung ano ang tunog ng mga ito kapag binibigkas ang mga ito. Ang mga aplikasyon ng WordNet sa linguistic programming ay nabanggit kasama ang maraming mga publikasyon at istatistika na magagamit sa site.
294. Allen Brain Atlas
Ang Allen Brain Atlas, na nilikha ng Allen Institute para sa Brain Science Resources, ay isang tool para sa pag-aaral at pag-aaral ng higit pa tungkol sa utak ng tao at kung paano ito tumutugon kapag ang katawan ng tao ay malusog pati na rin kapag may sakit. Gamit ang atlas, matututunan ng mga mananaliksik ang tungkol sa utak ng tao at ang pag-unlad nito pati na rin ang glioblastoma at ang epekto ng kanser sa utak. Maaaring bisitahin ng mga mamamahayag na sumasaklaw sa mga paksang ito ang site na ito para sa mga dataset at impormasyon.
295. NITRC
Ang NITRC, o ang Neuroimaging Informatics Tools and Resources Clearinghouse, ay kung saan maaaring pumunta ang mga mamamahayag at publisher para sa neuroimaging. Pinagsama-sama at na-promote bilang isang inisyatiba para sa neuroimaging sa pagbabahagi ng data, ang site na ito ay tahanan ng data mula sa ilang mga proyekto tulad ng 1000 Connectome Project, ang Addiction Connectome Preprocessed Initiative, pati na rin ang INDI-Prospective at Retrospective na mga proyekto ayon sa pagkakabanggit. Ang mga indibidwal ay libre upang i-download ang data sa pamamagitan ng website. Ang mga neuroimage na kinunan sa iba't ibang yugto ay hindi pa gaanong naa-access.
296. HCP Young Adult
Ang Proyekto ng Human Connectome na Young Adult na proyekto ay isang pagpapatuloy ng patuloy na pagsisikap na lumikha ng isang tumpak na mapa ng human connectome gaya ng makikita sa karamihan ng mga normal na nasa hustong gulang. Sa pamamagitan ng dalawang yugto, 1200 malulusog na matatanda ang na-scan sa pamamagitan ng kumbinasyon ng mga diskarte sa resting-state fMRI at diffusion imaging. Ang mga mamamahayag at publisher na naghahanap ng impormasyon sa utak ay hindi makakahanap ng isa pang site na may higit pang data sa koneksyon ng tao sa malusog na mga young adult.
297. NIMH Data Archive
Ang NIMH Data Archive, o NDA para sa maikling salita, ay hindi isang independiyenteng mapagkukunan ng data dahil ito ay isang platform para sa pamamahagi at pag-iimbak ng data. Sa website na ito, mayroong data na nakolekta sa kabuuan ng maraming mga papeles at proyekto ng pananaliksik pati na rin ang pagbibigay ng mga pamamaraan at tool na nagbibigay-daan sa mas mahusay na pagsusuri at pakikipagtulungan. Ang mga buod ng data ay malayang magagamit at ang mga tagapagbigay ng nilalaman na nag-uulat ng pinakabago sa agham ay maaaring gumamit ng impormasyong ito upang magbalita.
298. Neurodata
Ang NeuroData ay nakatuon sa pagsasagawa ng pananaliksik sa natatanging ugnayan sa pagitan ng isip at utak. Salamat sa pangako ng site na buksan ang agham at maaaring kopyahin na pananaliksik, ang mga nagbibigay ng nilalaman ay may access sa isang publikasyon at ilang mga dataset na maaaring ma-access sa pamamagitan ng pagsunod sa mga link sa web page. Ang partikular na interes sa mga gustong makita ang data para sa kanilang sarili ay ang pagkakaroon ng libreng code at mga tool sa pagsusuri na ginagawang mas tapat ang paggalugad sa gawain ng NeuroData.
299. NeuroElectro
Dinisenyo ang NeuroElectro Project na may layuning kolektahin ang iba't ibang katangian ng electrophysiological na nauugnay sa iba't ibang uri ng neuron at pagsasama-samahin ito sa isang database. Ang proyektong ito ay naglalayong pag-aralan ang relasyon sa pagitan ng mga neuron sa pagsisikap na pag-aralan ang mga pagkakaiba sa pagitan ng iba't ibang uri ng neuron. Ang site ay nagli-link sa mga artikulo at naglilista ng mga uri ng neuron at mga katangian ng electrophysiology na natuklasan sa ngayon. Maaaring umasa ang mga provider ng nilalaman sa site na ito bilang pinagmumulan ng data sa mga ugnayang neuron-to-neuron.
300. Open Access Serye ng Imaging Studies
Ang Open Access Series of Imaging Studies, na kilala rin ng marami bilang OASIS, ay isang proyekto na idinisenyo na may layuning gawing naa-access ang mga dataset ng mga brain MRI sa pang-agham na komunidad sa pangkalahatan. Maaaring ma-access ng mga mamamahayag at mananaliksik ang mga publikasyon na naghahambing ng data ng MRI sa pagitan ng mga nasa hustong gulang pati na rin ang isang komprehensibong fact sheet mula sa komprehensibong papel ng OASIS na naghahambing at nagkukumpara sa mga resulta mula sa mahigit 400 paksa. Maaaring ma-download ang impormasyon at mga tool mula sa website sa ilang mga format.
301. OpenfMRI
Para sa mga mamamahayag na gustong mag-access ng mga dataset ng MRI nang walang anumang abala na nauugnay sa ilang iba pang mga site, ang pagtutok ng OpenfMRI.org sa paggawa ng mga MRI dataset na naa-access sa publiko ay isang positibong pag-unlad. Direktang nagmumula sa mismong mga mananaliksik, ang site na ito ay nagho-host ng iba't ibang mga dataset tulad ng dataset ng pag-aaral ng klasipikasyon, ang mixed-gambles na gawain, at ang balloon analog na risk-taking task. Ang pagkakaiba-iba at dami ng data ay ginagawang posible para sa mga mananaliksik na makahanap ng mga bagong paraan ng pagtatanong sa pamamagitan ng site na ito.
302. Studyforrest
Hiram nang husto ang pangalan nito mula sa sikat na pelikulang Forrest Gump, ng studyforrest na maunawaan kung ano ang kaya ng utak kapag kailangan itong gumanap sa mas mataas na antas habang nakikipaglaban sa natural ngunit parehong kumplikadong pagpapasigla. Gayunpaman, kinikilala ng site na ang dami ng data ng fMRI na nakolekta mula sa mga pag-aaral na ito ay may mas malawak na mga aplikasyon kaysa sa tila sa una. Maaaring mag-browse ang mga provider ng nilalaman sa 19 na publikasyon na gumamit ng studyforrest data at maaaring direktang ma-access ang data.
303. Crystallography Buksan ang Database
Gaya ng natural na inaasahan mula sa pamagat, ang Crystallography Open Database ay isang koleksyon ng 385,697 metal-organic na mineral at compound, organic, at inorganic na mga istrukturang kristal na may kapansin-pansing pagbubukod ng mga biopolymer. Ang mga provider ng nilalaman na naghahanap upang matuto nang higit pa tungkol sa mga istrukturang kristal ay maaaring maghanap ayon sa pormula ng istruktura o magpatakbo ng isang katugmang query sa paghahanap na may opsyong mag-browse. Mayroon ding software at data sa site na ito na ginagawang mas mahalaga ang website na ito sa larangan ng chemistry.
Matagal nang itinuturing na isa sa mga nangungunang mapagkukunan ng impormasyon sa kalawakan, ang NASA ay nagpapatuloy sa tradisyon nito na maging isang napakahalagang mapagkukunan kasama ang Exoplanet archive nito. Ang site na ito ay nagho-host ng isang serye ng mga interactive na tool at software tulad ng Transit at Ephemeris Service, ang Periodogram, ang Confirmed Planets Plotting Tool, at ang kakayahang interactive na mag-upload ng mga file at mga talahanayan ng paghahanap. Maaaring gamitin ng mga provider ng content na naghahanap ng mga natatanging insight ang data na ito para magawa ito sa susunod na pagkakataong gumawa ng malaking balita ang mga exoplanet.
Ang kakayahang lumikha ng mga three-dimensional na mapa ng Uniberso ay posible para sa sinuman na gawin sa tulong ng Sloan Digital Sky Survey, o SDSS. Maaaring ma-access ng mga reporter at provider ng nilalaman ang mga algorithm, data ng imaging, mga dataset, tutorial, at karagdagang pag-unlad ng mga visual na materyales para sa layunin ng pagtuturo sa publiko sa parehong pormal at impormal. Ang site ay tahasang tinatalakay din ang paggawa ng data nito na ma-access ng publiko sa pamamagitan ng balita at social media. Ito ay isang napakahalagang visual na tool para sa mga provider ng nilalaman.
306. StatSci.org
Nag-aalok ang Statsci.org ng komprehensibong listahan ng mga mapagkukunan na maaaring ma-access at magamit ng publiko depende sa kanilang partikular na pangangailangan. Ang ilan sa mga impormasyon ay kinabibilangan ng Electronic Dataset Service at mga case study na pinagsama-sama ng UCLA. Kasama ang mga hilaw na dataset, mayroon ding mga textbook na naka-link sa pahinang ito. Kabilang dito ang mga pamagat gaya ng Handbook of Small Data Sets at Case Studies sa Biometry. Ang mga provider ng nilalaman na naghahanap ng istatistika ay hindi maaaring magkamali sa pagtingin dito.
307. ERIC
Ang ERIC, na kilala rin bilang Institute of Education Sciences, ay isang mapagkukunan na gumaganap bilang isang search engine para sa sinumang naghahanap ng impormasyon sa larangan ng edukasyon. Ang paunang paghahanap ay nagbibigay pa nga ng opsyon na mag-filter ng eksklusibo para sa peer reviewed na impormasyon pati na rin para sa ERIC-based na buong teksto. Dahil sa kung gaano kadalas ang mga badyet sa edukasyon at mga paraan ng pagtuturo ay tila nasa balita, ito ay isang mapagkukunan ng data na dapat tandaan ng mga mamamahayag.
308. NTIS
Nilikha sa ilang sandali pagkatapos ng pagtatapos ng World War 2, ang NTIS (National Technical Information Service) ay nabuo na may layuning gumamit ng data upang matulungan ang mga pederal na ahensya na gumawa ng matalinong mga desisyon na nakabatay sa data sa pamamagitan ng paggamit ng data. Ang ahensyang ito ay orihinal na imbakan ng data ng gobyerno ng US sa larangan ng siyentipikong pananaliksik. Ngayon, ang site ay nagho-host ng milyun-milyong publikasyon sa napakaraming paksa. Ang makasaysayang impormasyon lamang ay ginagawang karapat-dapat ang site na ito bilang mapagkukunan ng data para sa mga mamamahayag at publisher.
309. Buksan ang Data Certificate
Ang website ng ODI (Open Data Institute) ay tahanan ng tinatawag na Open Data Certificate, na isang libreng tool na available online na binuo para sa malinaw na layunin ng kritikal na pagsusuri at pagkilala sa kalidad ng bukas na data. Mula sa pananaw ng isang publisher o isang mamamahayag, nagho-host din ang site ng maraming dataset sa mga paksa mula sa mga listahan ng mga grant hanggang sa mga alerto sa allergy kasama ang mga listahang maaaring ma-download sa CSV na format.
310. GitHub Archive
Ang GitHub ay madaling isa sa pinakasikat at kilalang mga repositoryo at archive ng data sa Internet dahil sa kadalian ng pakikipagtulungan, mga kapasidad ng archive, at pagiging naa-access kung saan ang coding ay nababahala. May kasama man itong mga pagtatangka na lumikha ng mga bot na maaaring magsagawa ng ilang partikular na gawain, o pagbuo ng mga application, ang GitHub ay isang site kung saan ang mga publisher ng nilalaman at mga mamamahayag ay madaling matitisod sa mga potensyal na karapat-dapat na balita. Maaaring ma-access ang archive sa pamamagitan ng pagsunod sa mga tagubilin sa tutorial para sa alinman sa JSON o Big Query.
311. SocioPatters
Ang SocioPatterns ay isang proyekto na nakatuon sa paghahanap ng mga pattern sa aktibidad ng tao at panlipunang dinamika sa kabila ng data. Tulad ng inaasahan sa isang malawak na nakasaad na layunin, ang impormasyon ng site ay ginamit sa mga publikasyong tumutugon sa isang hanay ng mga paksa mula sa pagkalat ng sakit hanggang sa mga case study sa mga pagkakaiba sa pagitan ng online at offline na katauhan ng mga indibidwal. Ang mga dataset ay magagamit para sa pagtingin tulad ng mga naka-publish na papel na naglalaman ng impormasyon na malamang na mahanap ng mga publisher na may kaugnayan sa isang punto o iba pa.
312. Indie Map
Ang Indie Map ay ang resulta ng pagkuha ng impormasyon mula sa mahigit 2,000 sa mga pinakaabala na site ng IndieWeb at pag-roll sa data sa mga interactive na visual na form gaya ng Social Graph API, isang dataset na may mga kakayahan sa SQL query, at ang raw na impormasyon na na-crawl sa kabuuang 5.7 milyong mga web page. Ang mga digital na publisher na interesado sa open source software at kung ano ang maaaring sabihin ng data na ito tungkol sa mga online na komunidad na ito ay maaaring ma-access ang impormasyon nang direkta mula sa website.
313. Unibersidad ng Simon Fraser
Patuloy na itinatatag ni Simon Fraser ang katayuan nito bilang isang kagalang-galang na unibersidad na may pagkakaroon ng dataset nito tungkol sa "Mga Istatistika at Social Network ng Mga Video sa YouTube." Pagkuha ng impormasyon mula sa isang crawler na gumamit ng API ng YouTube upang maghanap ng mga video, naglalaman ang mga file ng data sa milyun-milyong video at mga dataset ng impormasyon ng user. Tinukoy ng site na ang mga pag-download ng dataset ay para sa mga layuning pang-akademiko lamang, ngunit maaaring posible na makahanap ng mga mapagkukunan ng pamamahayag at mga sanggunian sa proyektong ito sa pamamagitan ng site.
314. ACLED
Ang ACLED, o ang Armed Conflict Location and Event Data Project, ay nag-aalok ng pampublikong data tungkol sa protesta at pampulitikang karahasan sa papaunlad na mundo. Kasama sa impormasyong ibinigay dito ang mga numero sa mga nasawi, impormasyon sa mga petsa at lugar ng karahasan o protesta, mga pangalan ng mga nauugnay na grupo, at data sa mga kaguluhan at marahas na sagupaan na naganap. Nagbibigay ang ACLED ng access sa mga regular na ulat, publikasyon, at visual pati na rin sa data na magagamit para sa pag-download sa site.
315. Canadian Legal Information Institute
Ang Canadian Legal Information Institute, o CanLII kung tawagin sa regular na pananalita, ay isang site na nagbibigay ng libreng pag-access sa mga estatwa at kanilang mga regulasyon, batas ng kaso mula sa mga korte ng iba't ibang hurisdiksyon kabilang ang Korte Suprema ng Canada, ang mga korte ng probinsya at apela, at ang Queen's Bench, kasama ang mga desisyon mula sa iba't ibang administrative tribunal at mga katawan na nilikha ayon sa batas. Sa 301 database ng batas ng kaso at higit sa 140,000 desisyon ng hukuman na magagamit para sa pagtingin, ang mga mamamahayag at digital na publisher na sumasaklaw sa mga legal na paksa ay makikinabang sa pag-bookmark sa site na ito.
316. Sentro para sa Systemic Peace
Ang Center for Systemic Peace, o CSP, ay isang organisasyon na nagtalaga ng sarili sa pagsusuri ng mga pandaigdigang sistema para sa layunin ng pagtugon sa isyu ng karahasan sa pulitika. Sa site na ito, ang mga mamamahayag na nagsasaliksik sa lugar na ito ay magkakaroon ng access sa pagsusuri sa conflict sa Africa, conflict trends sa isang pandaigdigang antas bukod sa iba pa kasama ang mga buod sa tatlong pangunahing publikasyon ng organisasyon tulad ng Third World War at Global Report at Virtual ng CSP. Aklatan.
317. Mga Kaugnay na Proyekto ng Digmaan
Ang pokus ng proyektong Correlates of War, o COW, ay tumulong sa pangangalap at pamamahagi ng dami ng data tulad ng sa larangan ng internasyonal na relasyon. Sa pagsunod sa pangako nito sa paglalapat ng mga siyentipikong prinsipyo sa data ng mga relasyon sa internasyonal, ginagawa ng COW ang mga dataset nito na malayang naa-access sa publiko. Ang mga database na ito ay naglalaman ng mga numero sa impormasyon na magagamit ng mga mamamahayag at mananaliksik tulad ng militarisadong mga salungatan sa pagitan ng mga estado, mga miyembro ng sistema ng estado, mga pambansang materyal na kakayahan, at mga pormal na alyansa.
Ang European Social Survey, o ang ESS, ay isang survey na isinasagawa sa buong Europe na may layuning sukatin ang iba't ibang pattern ng pag-uugali, saloobin, at paniniwala ng iba't ibang populasyon sa iba't ibang bansa. Dahil ang mga mamamahayag ay madalas na interesado sa pagkuha ng opinyon ng publiko, ang ESS Topline Series na sumasaklaw sa mga paksa na mula sa personal at panlipunang kagalingan ng mga Europeo, mga saloobin patungo sa kapakanan, at maging ang pagkakaroon ng ageism sa UK, ay maaaring palakasin ang isang kuwento sa higit pa mga paraan kaysa sa isa.
319. Pondo para sa Kapayapaan
Ang Pondo para sa Kapayapaan ay isang organisasyon na nakatutok sa pagpigil sa salungatan at pagtutuon ng pansin sa seguridad sa pamamagitan ng pagbuo ng mga tool na magagamit upang mabawasan ang salungatan. Sa kabuuan ng karera ng FFP, nakipagtulungan ito sa mga mamamahayag, NGO, lokal na organisasyon at kanilang mga internasyonal na katapat, gayundin sa mga pamahalaan. Naghahanap man ng mga uso, paghahambing na pagsusuri, at pandaigdigang data, mahahanap ng mga mamamahayag at publisher ang mga materyales na gusto nila sa pamamagitan ng tool sa pag-explore ng data sa browser ng site.
320. Ang General Social Survey
Nakatuon ang gawain ng General Social Survey (GSS) sa pangangalap ng impormasyon sa iba't ibang aspeto ng modernong lipunang Amerikano bilang isang paraan ng pagsubaybay sa mga uso at pattern ng ugali at pag-uugali sa populasyon. Sa ganitong kasanayan ng pagsubaybay sa trend na bumalik sa 1972, ang makasaysayang data lamang ay isang goldmine para sa mga mamamahayag na gustong tuklasin ang mga uso. Gamit ang GSS Data Explorer, nagagawa ng mga mananaliksik at mamamahayag na mag-download, magsuri, at magsuri ng data.
321. Gesis
Ang GESIS ay isang institusyong pang-imprastraktura ng Germany na nakatuon sa mga agham panlipunan. Nag-aalok ito ng iba't ibang agham panlipunan, kasama ang gawaing pananaliksik at mga serbisyo na mula sa pamamaraan ng survey hanggang sa inilapat na agham sa kompyuter, pagkolekta ng data, pagpaplano ng pag-aaral, at pagsusuri ng data upang pangalanan ang ilan sa ginagawa ng GESIS. Ang mga mamamahayag na interesado sa mga paksa tulad ng diskarte sa GESIS sa pamamaraan, ang paggamit ng mga over-qualified na imigrante, at higit pa ay makakahanap ng maraming impormasyon sa seksyon ng publikasyon.
322. Pandaigdigang Relihiyosong Kinabukasan
Mula sa mga paksang tulad ng aborsyon hanggang sa edukasyon sa sex, ang relihiyon ay napakalawak, na kahit na sa karamihan ng mga sekular na bansa ang posisyon ng isang tao sa mahihirap na panlipunang paksa ay maaaring maimpluwensyahan ng relihiyosong paniniwala. Sa Global Religious Futures, sinusuri ng Pew Research Center ang mga uso sa mga saloobin at paniniwala ng mga tao na nauugnay sa mga pandaigdigang relihiyon. Ang mga mamamahayag na naghahanap upang suriin ang mga detalye tulad ng impluwensya ng Evangelicalism sa pulitika o mga saloobin sa pagbato ay maaaring gumamit ng Data Explorer upang makahanap ng mga sagot sa mga numero.
323. Index Para sa Pamamahala ng Panganib
Ang Index para sa Pamamahala ng Panganib, na kilala rin bilang INFORM, ay isang lugar na maaaring puntahan ng mga mananaliksik at mamamahayag para sa mga pagtatasa ng panganib sa mga sitwasyon kung saan may panganib ng isang makataong krisis o kalamidad. Nag-aalok ang organisasyon ng mga link sa data sa mga paksa tulad ng mga rate ng pagkamatay ng bata, index ng hindi pagkakapantay-pantay ng kasarian, at mga dalas ng tagtuyot bukod sa iba pang mga numero. Posible ring makita at i-download ang data ng INFORM o i-access ito sa pamamagitan ng interactive na mapa ng site.
324. INED
Ang INED, o ang French Institute for Demographic Studies, ay isa sa pinakamaraming mapagkukunan ng data at istatistika na mahahanap ng isang mamamahayag sa Internet. Sa higit sa 70 mga publikasyon na sinasaliksik at nai-publish bawat taon upang sumama sa populasyon ng mundo sa format ng graph pati na rin ang mga istatistika na sumusukat sa mga tanong tulad ng pagkakaiba sa pagkamayabong sa pagitan ng mga kasarian upang pumunta sa mga pamamaraan ng balita at mapagkukunan. Ang mga mananaliksik sa pagtugis ng tumpak na mga natuklasan mula sa isang kagalang-galang na mapagkukunan ay mahahanap sila sa INED.
325. International Networks Archive
Nag-aalok ang Princeton's International Networks Archive ng kakaibang kumbinasyon ng mga publikasyon, na may pananaliksik tulad ng Human Development Report 1999 at Global Networks: A Journal of Transnational Affairs na magagamit para sa pagbabasa sa site na ito. Sa site na ito, masusuri ng mga mamamahayag ang komprehensibong pampublikong makasaysayang at napapanahong data ng archive. Kasama sa mga paksang sakop dito ang pangangalagang pangkalusugan, armas, aklat, musika, migration, rehiyon, Internet, pulitika, at transportasyon ay isang sample lamang ng mga materyal na maaaring basahin ng mga mananaliksik dito.
326. International Social Survey Program
Itinatag mula sa simula bilang isang paraan ng pakikipagtulungan sa pagitan ng mga tao ng iba't ibang mga bansa, ang International Social Survey Program (ISSP) ay nagsagawa ng mga survey bawat taon sa iba't ibang mga paksa na mahalaga sa larangan ng agham panlipunan. Ang mga paksa sa paglipas ng mga taon ay kinabibilangan ng hindi pagkakapantay-pantay sa lipunan, pambansang pagkakakilanlan, pagkamamamayan, mga social network, at oryentasyon sa trabaho bukod sa iba pang mga bagay. Ang mga natuklasan ng ISSP ay maaaring hanapin ayon sa taon o ayon sa paksa at maaaring ma-download nang naaayon sa website.
327. Mga Asosasyon ng International Studies
Ang mga mamamahayag o iba pang mananaliksik na naghahanap ng impormasyon, intelektwal na talakayan sa mga isyu na nauugnay sa paksa ng transnational, internasyonal, at pandaigdigang mga bagay, pinagsasama-sama ng International Studies Association (ISA) ang kadalubhasaan ng mga mananaliksik, akademya, at eksperto sa patakaran sa pagitan ibang mga pangalan. Ang Encyclopedia of International Studies ng ISA ay nagtatampok ng mga peer-reviewed na sanaysay na puno ng malalim na talakayan sa mga paksang may kinalaman sa pananaliksik sa larangang ito pati na rin ang mga sanaysay na nagbibigay ng impormasyong sinabi mula sa isang mas makasaysayang pananaw.
328. Cross-National na Data sa Web
Ang hindi kapani-paniwalang kapaki-pakinabang na pahina ng Propesor James W. McGuire ng Unibersidad ng Wesleyan, na angkop na pinamagatang Cross-National Data sa Web, ay isang mapagkukunang pahina na puno ng mga link sa nauugnay na data sa pag-unlad ng ekonomiya at pandaigdig. Kabilang sa mga dataset na matutuklasan ng mga mamamahayag dito, mayroong data sa pagpaplano ng pamilya, tagumpay sa edukasyon, kakulangan sa sustansya, tubig at kalinisan, oryentasyon sa free-market at impormasyong partikular sa Latin America at Caribbean upang pangalanan lamang ang ilan mula sa listahan. Ang mga pinagmumulan ng data na nakalista dito ay hindi nagkakamali.
329. Norwegian Center para sa Data ng Pananaliksik
Ang Norwegian Center for Research Data ay isang institusyon na sumusuporta at tumutulong sa mga mananaliksik sa iba't ibang larangan ng pagsasagawa ng empirical na pananaliksik tulad ng privacy, pagkolekta at pagsusuri ng data, pagsusuri ng metodolohiya, at etika sa pananaliksik. Dito, makakahanap ang mga mananaliksik ng software at mga tool na binuo at inirerekomenda ng sentro upang sumama sa isang malawak na koleksyon ng data sa rehiyon, indibidwal, at institusyonal na maaaring ma-access nang libre. Ang mga natuklasan ng sentro sa Taunang Ulat ng Pananaliksik at Pagkapribado ay palaging isang kawili-wiling basahin.
330. IPUMS
Ang IPUMS ay hindi nangangahulugang isang data source sa diwa na inaasahan ng karamihan sa mga tao kapag narinig ang termino, ngunit gayunpaman, ito ay isang kapaki-pakinabang na mapagkukunan para sa mga mamamahayag dahil sa tungkulin nito bilang isang aggregator, archiver, at tagapag-ayos ng data na ibinibigay ng ibang entity. Halimbawa, ang IPUMS USA ay gumaganap bilang isang uri ng repository ng data para sa microdata ng census ng US, na may data na mula noong 1790 at dating hanggang sa kasalukuyan.
331. ND-GAIN
Ang ND-GAIN Country Index, isang inisyatiba na inayos ng University of Notre Dame Global Adaptation Initiative, ay sumusukat sa katatagan ng isang bansa sa pagbabago ng klima at iba pang puwersa ng globalisasyon. Kasama sa index na ito ang mga marka ng kahinaan sa mga lugar tulad ng pagkain, kalusugan, imprastraktura, at ecosystem pati na rin ang mga marka ng kahandaan para sa kasing dami ng 500,000 data point. Naglalaman ng dalawang dekada ng data mula sa mga taong 1995 hanggang 2014 sa anyo ng mga CSV file, ang impormasyong ito ay magagamit para sa pag-download.
332. Pulis UK
Sa site na ito, maa-access ng mga mamamahayag at publisher ang bukas na data tungkol sa estado ng pagpupulis at krimen sa United Kingdom. Ang data ay naglalaman ng mga kapaki-pakinabang na istatistika sa mga koponan ng kapitbahayan, indibidwal na pwersa ng pulisya, mga numero ng paghinto at paghahanap, pati na rin ang mga istatistika sa krimen at mga resulta. Gamit ang site na ito, maaaring magpatakbo ang mga mamamahayag ng mga paghahambing sa pagitan ng mga puwersa ng pulisya, at makita ang mga uso sa hustisyang kriminal. Ang pagkuha ng impormasyon ay kasing simple ng pagpili ng hanay ng petsa, pagpili ng puwersa ng pulisya, at pagkatapos ay maghintay para sa file.
333. Pangkalahatang International Data Page ni Paul Hensel
Ang Pangkalahatang International Data Page ni Paul Hensel ay isang serye ng mga link na naka-grupo sa ilalim ng mga heading na Estado at International System, International Geographic Data, State Capabilities, Social Science Data Collections, at Alliances, Treaties, at Organizations. Ang bawat resource na nakalista sa web page na ito ay naglalaman ng state of the art data na awtomatikong magbibigay ng kredibilidad sa gawa ng isang mamamahayag. Ang mga mapagkukunang ito ay maaaring magsama ng anuman mula sa software hanggang sa mga dataset at archive, ngunit ang bawat link na kasama dito ay kapaki-pakinabang.
334. TRAC
Sa post-911 na mundo, ang terorismo at ang mapangwasak na epekto nito sa mga lokal na populasyon ay nakakuha ng maraming atensyon sa media. Ang TRAC, sa trackingterrorism.org, ay nagbibigay sa mga mananaliksik ng malawak na pagsusuri at impormasyon tungkol sa mga paksang ito. Ang site na ito ay naglalaman ng impormasyon sa ilang libong iba't ibang grupo ng terorista. Ang presyo ng single-user na $500 ay maaaring medyo matarik sa harap ngunit sulit ang presyong binayaran para sa mga nagsusulat tungkol sa karahasan at digmaan laban sa terorismo.
335. Texas Department of Criminal Justice
Interesado sa mga panloob na gawain ng Texas Criminal Justice system? Gustong malaman kung sino ang kasalukuyang nasa death row? Ang Kagawaran ng Kriminal na Hustisya ng Estado ng Texas ay maraming impormasyon mula sa mga huling pahayag ng mga bilanggo bago ang pagbitay, mga istatistika ng death row ayon sa kasarian at lahi, pati na rin ang mga karagdagang istatistika at factsheet ng pagpapatupad. Ang Texas Department of Criminal Justice ay kasing maaasahang source para sa mga mamamahayag.
336. Integrated Civil Society Organizations System
Ang pinagsamang Civil Society Organizations System, o iCSO, ay idinisenyo upang gawing mas madali para sa mga civil society organization na makipag-ugnayan sa Department of Economic and Social Affairs. Bilang karagdagan sa pagiging epektibo ng matatag na balangkas, kasama sa web page ang mga dataset at kategorya para sa karagdagang impormasyon. Ang data ay maaaring pagbukud-bukurin ayon sa sektor, ang uri ng organisasyon, ang rehiyong kasangkot, at ang katayuan ng ECOSOC ng organisasyon. Ito ay isang mapagkukunan ng data na tiyak na magagamit ng mga mamamahayag para sa paghahanap ng mga mapagkukunan.
337. Unibersidad sa Buong Mundo
Ang Unibersidad sa buong mundo ay isang database ng mga unibersidad sa buong mundo na maaaring hanapin para sa karagdagang impormasyon. Ang paghahanap ay maaaring gawin sa pamamagitan ng listahan ng mundo o i-filter ng eksklusibo sa mga unibersidad sa Estados Unidos, at ang mga user ay makakapagdagdag din ng kanilang sariling mga link sa proseso. Ang mga publisher ng data na may malaking contingent ng mag-aaral, o kahit na mga mamamahayag na naghahanap upang i-verify ang isang katotohanan, lahat ay maaaring makinabang mula sa kakayahang ma-access ang isang database na tulad ng isang ito on-demand.
338. Uppsala Conflict Data Program
Ito ang website para sa Uppsala Conflict Data Program, na isa sa mga pinakakilalang tagapagbigay ng impormasyon tungkol sa organisadong karahasan. Sa paglipas ng huling 40 taon ng programa, itinatag din nito ang sarili para sa trabaho nito sa pagkolekta ng data mula sa digmaang sibil. Maaaring gamitin ng mga mamamahayag ang data source na ito upang maghanap ng impormasyon tungkol sa mga partikular na salungatan at mga aktor sa mga salungat na iyon at maaari ding ma-access ang data na ito para sa mga layunin ng pag-download nito.
339. World Pop
Ang proyekto ng WorldPop, ang huling resulta ng pagsasama-sama ng mga proyekto ng AsiaPop, AfriPop, at AmeriPop, ay nakatuon sa pag-archive ng mga spatial na demograpikong dataset na may mga aplikasyon bilang paraan ng pagbibigay ng suporta sa mga pagsisikap sa pagtulong sa kalamidad. Ang mga publisher ng nilalaman at mga mamamahayag na kasangkot sa mga layunin ng hustisyang panlipunan o kung hindi man ay nagsasaliksik ng mahusay na mga pagkakataon sa pagtulong sa sakuna ay magiging interesado sa proyektong ito. Maaaring i-download ng mga mananaliksik ang data o suriin ang mga case study online.
340. Draft Express
Ang DraftExpress ay marahil pinakakilala sa Internet para sa kanyang pagsasaliksik, mga ulat ng pre-draft scouting, mga kunwaring draft na pinili, at ang maselang pagpapanatili ng mga taas at sukat ng manlalaro upang sumama sa makasaysayang data nito. Ang mga prospect na binanggit sa site na ito ay nagmula sa NCAA, high school, at maging sa mga internasyonal na liga. Ang mga mamamahayag ng sports o content provider na naglalayong mag-alok ng komentaryong nauugnay sa basketball ay maaaring pumunta sa mga istatistika ng DraftExpress habang tinatalakay ang mga manlalaro at kaganapan habang nangyayari ang mga ito sa loob ng sport.
341. Betfair
Ang Betfair ay marahil pinakamahusay na kilala bilang ang site na pupuntahan para sa mga taya sa sports. Ang interes sa mga provider ng nilalaman at mga digital na publisher sa partikular, gayunpaman, ay ang pagkakaroon ng detalyadong makasaysayang impormasyon sa data at kasaysayan ng pagpepresyo ng site. Maaaring ma-access at ma-download ang data nang mayroon o wala ang detalyadong time-stamp habang nag-aalok din ng malawak na data sa horseracing at iba pang mga alok sa merkado ng site mula sa taong Hunyo ng 2004 hanggang Oktubre ng 2017.
342. CRICSHEET
Nag-aalok ang Cricsheet ng katulad na serbisyo sa ilang iba pang mga hub ng data ng sports, ngunit isa itong site na eksklusibong nagdadalubhasa sa pagbibigay ng data ng kuliglig. Ang site ay nag-aalok ng mga istatistika at bola-by-bola na data mula sa isang bilang ng mga liga kabilang ang Indian Premier League, isang araw na internasyonal, pati na rin ang mga numero para sa mga pangkat ng kalalakihan at kababaihan upang pangalanan lamang ang ilan sa mas malalaking kategorya. Maaaring i-download ng mga publisher ng nilalaman na naghahanap ng makasaysayang data ng kuliglig ang data sa alinman sa CSV o XML na format.
343. Cross-National Time-Series na Data
Sa pampulitikang, pang-ekonomiya, pambatasan, at domestic conflict data na sumasaklaw sa mahigit 200 taong halaga ng data sa mahigit 200 bansa sa buong mundo, ang Cross-National Time-Series Data Archive ay isa sa mga pinakakomprehensibong dataset sa Internet. Ang data ay iniimbak, pinaka-maginhawa, sa isang Google Drive sheet na awtomatikong bubukas kapag nag-click sa kategorya ng file. Bilang kapalit ng isang pagsipi, ang impormasyong ito ay maaaring tingnan sa bahagi o kabuuan depende sa pangangailangan ng mananaliksik.
344. Ford GoBike
Ang Ford GoBike ay ang pangalan ng bike share program na ginagamit sa Bay Area. Bagama't walang alinlangan na maraming tao ang gumagamit ng programang ito para manatiling fit at maiwasan ang paggamit ng fossil fuels, sinusubaybayan ng bike share system ang data ng biyahe. Siyempre, hindi kasama sa impormasyong ito ang anumang bagay na maaaring makilala ang mga sakay ngunit ang mga detalye tulad ng numero ng bike, oras ng pagsisimula, oras ng pagtatapos, uri ng rider, at mga istasyon ng pagdating at pag-alis ay kasama sa data. Iyan ay nagkakahalaga ng paggalugad.
345. Trapiko sa dagat
Ang Marine Traffic ay isang kumpanyang sumusubaybay at sumusubaybay sa mga galaw ng mga sasakyang pandagat at paglalakbay sa karagatan gamit ang malaking data. Kasama sa uri ng impormasyong saklaw ng mga serbisyo ng AIS API ng Marine Traffic ang mga sasakyang-dagat, impormasyon sa mga paglalakbay, at data sa mga sasakyang pinag-uusapan gaya ng mga inaasahang pagdating, maging ang mga insidente, larawan, detalye ng sasakyang-dagat, at mga hula sa paglalakbay. Mayroong mga plano sa pagpepresyo sa site na ito, gayunpaman, kaya hindi malinaw kung gaano karaming pananaliksik ang maaaring gawin nang libre.
346. Bixi
Ang mga bixi bike share program ay marahil ang ilan sa mga pinakakilalang bike share program sa ilan sa mga pinakamalaking lungsod sa North America. Kapansin-pansin, naglalabas din ang brand ng bukas na data na nagbibigay ng impormasyon sa mga bagay tulad ng history ng biyahe at status ng istasyon pati na rin ang mga paghahambing na maaaring gawin sa pagitan ng mga miyembro at paminsan-minsang user. Ang mga lokal na mamamahayag na tumitingin sa kung paano ginagamit ng mga indibidwal at angkop ang mga programa sa pagbabahagi ng bisikleta sa kanilang buhay ay may lahat ng dahilan upang tumalon sa data na ito.
Mula kay Amelia Earhart hanggang sa AirAsia Flight 8501 ng Indonesia, ang mga aksidente sa paglipad at eroplano ay isang paksa na umaakit sa atensyon ng mga tao. Ang Accident Database ay nag-a-archive at nag-iimbak ng data sa mga aksidente sa paglipad na naganap sa pagitan ng mga taong 1920 at 2017. Kasama sa mga aksidenteng binilang sa database na ito ang mga aksidente sa sasakyang panghimpapawid ng sibil at militar, mga aksidente na kinasasangkutan ng pagkamatay ng mga kilalang tao o isang sikat, mga aksidente sa helicopter na may 10 o higit pang pagkamatay , naka-iskedyul at hindi naka-iskedyul na mga flight ng pampasaherong hangin na nauwi sa kamatayan.
348. Transportasyon para sa London
Ang Transport for London ay ang katawan ng gobyerno na responsable para sa pangangasiwa ng pampublikong transportasyon sa lugar ng Greater London. Mayroong mga mapa ng tubo at riles na magagamit sa website kasama ang isang gabay sa pagpaplano ng paglalakbay. Bilang karagdagan sa lahat ng praktikal na serbisyong ito, nagho-host din ang site ng maraming bukas na data kabilang ang pagbibisikleta, kalidad ng hangin, batya, at maging ang talaba. Ang sinumang may interes na makita kung paano gumagamit ng pampublikong sasakyan ang mga residente ng Greater London ay maaaring makinabang sa pagkakaroon ng access sa data na ito.
349. CMAP
Responsable ang CMAP sa pagsasagawa ng pagpaplano at organisasyon ng rehiyon sa mga county ng DuPage, Lake, McHenry, Kendall, Kane, Cook, at Will sa Illinois. Tulad ng makikita mula sa website, ang mga responsibilidad ng CMAP ay umaabot sa pagtugon sa mga isyu tulad ng pagpapaunlad ng komunidad, mga buwis at mga tagapagpahiwatig ng ekonomiya, at maging ang mga kalsada at transit. Ito ang dahilan kung bakit ang bukas na data tungkol sa mga lugar tulad ng mga panrehiyong tagapagpahiwatig at paglalakbay ay kapaki-pakinabang sa isang mamamahayag na sinusubukang maunawaan ang malaking larawan kung saan ang kinabukasan ng rehiyon ay nababahala.
350. Framework ng Pagsusuri ng Freight
Dahil sa isang pakikipagtulungan sa pagitan ng Bureau of Transportation Statistics at ng Federal Highway Administration, ang Freight Analysis Framework ay nangongolekta ng data na pagkatapos ay ginagamit upang masuri ang pangkalahatang kalusugan at pagganap ng sistema ng kargamento. Nangongolekta ang software na ito ng impormasyon sa mga detalye tulad ng uri ng kalakal at tonelada kumpara sa mga istasyon ng pag-alis at pagdating at ang data na iyon ay ginawang available para ma-access at ma-download ng publiko nang buo o sa buod na anyo.
351. Mozilla Science
Ang Mozilla Science ay isang open source, open practice, collaborative na software na nandiyan para tumulong sa pagbuo at pamamahagi ng iba't ibang data source at research findings. Bukod sa mga interes ng transparency, ang desisyon na magbukas ng mga programa at mag-crowdsource sa proseso ng pagpipino ay nagpapadali sa pagbuti sa mga programang naroroon na. Sa mga proyektong magagamit sa iba't ibang larangan kabilang ang mga agham ng buhay at medisina bukod sa iba pa, mayroong mga solusyon sa software dito na maaaring kumakatawan sa karapat-dapat na pag-unlad sa larangan.
352. Mga Cool na Dataset
Ang atraksyon pagdating sa Cool Datasets ay madaling nakikita mula sa pangalan ng site. Sa page na ito, ang mga dataset ay nasa ilalim ng anim na pangkalahatang kategorya sa gobyerno, entertainment, science, pagsusumite ng user, miscellaneous, at machine learning. Ang mga mamamahayag na gustong tuklasin ang data at minahan ng mga kuwento ay naninindigan upang masulit ang pagsuri sa kung ano ang inaalok ng website na ito. Mayroong opsyon upang galugarin ang mga dataset at, kung maaari, mag-ambag din ng mga dataset.
Ang OpenDataMonitor ay isang platform na kumukuha ng mga pampublikong dataset at ipinapakita ang mga ito sa paraang mas intuitive at madaling sundin ng mga indibidwal. Ang mga mananaliksik ay maaaring pumunta sa platform upang makita ang isang buod ng kung ano ang kakayahan ng mga bukas na mapagkukunan ng data, at makikita nila ang umiiral na data na ipinakita sa kanila sa isang mas visual na nakakaengganyo na paraan. Ipinapaliwanag ng site ang pamamaraan at mga benchmark nito, at ang mga publisher ay dapat na walang problema sa paghahanap ng data na sulit na i-publish.
354. CrunchBase
Ang CrunchBase ay marahil pinakamahusay na kilala para sa pagbibigay-diin nito sa mga istatistika at ang kanyang pangako sa pagkuha ng mga mambabasa nito ng access sa pinakamahusay na data na magagamit. Ang mga taong may pag-iisip sa negosyo ay pumupunta sa site na ito araw-araw upang malaman ang tungkol sa pinakabagong mga uso sa pamumuhunan at industriya. Dito, makakahanap ang mga mamamahayag at publisher ng mga balita at sariwang talakayan ng mga pinakabagong uso sa negosyo. Samantala, bilang bahagi ng binabayarang opsyon nito, nagho-host din ang site ng mga malawak na dataset na maaaring masuri gamit ang mga tool ng software ng Crunchbase.
355. Index
Ang index ay isang platform na may natatanging proposisyon sa pagbebenta dahil mayroon itong maiaalok sa lahat sa pagitan ng mga startup, mamumuhunan, analyst, at mga korporasyon. Nagho-host din ang site ng impormasyon sa mahigit 100,000 kumpanya sa sektor ng teknolohiya habang sabay na nag-aalok sa mga user ng kakayahang mag-uri-uri, bumuo, at mag-export ng mga spreadsheet. Ang mga publisher at mamamahayag na nag-skim ng mga headline para sa mga potensyal na anggulo ng kuwento ay maaaring mauna sa mga balita sa negosyo sa pamamagitan ng site na ito. Maaaring hindi karaniwan ang index, ngunit walang duda na ito ay isang kapaki-pakinabang na mapagkukunan.
356. SEMRUSH
Ipinagmamalaki ng SEMrush ang sarili sa pagiging isa sa pinakamatatag na tool sa paghahanap ng katalinuhan na magagamit sa mga online marketer. Sa pagitan ng akademya at ng mga webinar, ang mga mananaliksik ay may bawat pagkakataong matutunan ang mga pangunahing kaalaman. Gayunpaman, ang mga seksyon ng blog at balita ay naglalaman ng sapat na impormasyon na madaling mapanatili ng mga publisher at mamamahayag sa tuktok ng lahat ng pinakabagong balita sa online na advertising at SEO. Ang mga serbisyo ng SEMrush ay dumating sa isang presyo, ngunit mayroong maraming kalidad ng impormasyon na ibinibigay nila nang libre.
357. Ahrefs
Ang Ahrefs ay marahil pinakamahusay na buod bilang isang hanay ng mga tool sa marketing na potensyal na kapaki-pakinabang sa sinumang naglalathala ng nilalaman online. Ang site ay nag-aalok ng kumbinasyon ng mga serbisyo tulad ng content research, web monitoring, keyword research, at backlink research para matulungan ang mga user na i-reverse engineer ang tagumpay ng mga kakumpitensya. Marahil ang pinakakapaki-pakinabang sa mga online na publisher sa engrandeng pamamaraan ng mga bagay, ang Ahrefs blog lamang ay kumakatawan sa mahusay na halaga para sa mga taong gusto ang kanilang marketing na ginawa gamit ang isang data-based na slant.
358. Listahan ng Anghel
Ang AngelList, na may matalinong napiling pangalan, ay karaniwang dalawang bahagi na Craigslist at isang bahagi ng LinkedIn na may diin sa pagsasama-sama ng mga mamumuhunan, naghahanap ng trabaho, at mga startup sa isang lugar. Kasabay ng kawili-wiling konsepto ng site na ito, maraming pagkakataon para sa mga masigasig na mamamahayag na matuklasan ang pinakamainit na mga startup at ang pinakabagong trend sa pamumuhunan bago sila maging mainstream. Sa pamamagitan ng direktang interface nito at ang malakas na oryentasyon nito sa negosyo, ang site na ito ay kapaki-pakinabang para sa mga propesyonal sa mas maraming paraan kaysa sa isa.
359. Nakuha
Sa halos lahat ng sektor, maaaring baguhin ng isang pagkuha ng negosyo ang isang buong industriya halos magdamag. Ang Acquired ay isang site na nagsasagawa ng gawain ng pagpapanatiling kaalaman sa mga miyembro ng publiko kapag ang isang pagkuha ay ginawa sa sektor ng teknolohiya. Puno ng mga istatistika na maaaring matingnan sa site upang pumunta nang may kakayahang mag-filter ng mga paghahanap, ang mga mamamahayag na nagsusulat tungkol sa teknolohiya ay naninindigan upang masulit ang paggawa sa Acquired bilang isang regular na bahagi ng kanilang pang-araw-araw na pagba-browse sa web.
360. Mattermark
Ang Mattermark ay isang bayad na serbisyo na nagpapadali sa buhay para sa mga gumagawa ng desisyon ng kumpanya sa pamamagitan ng paggawa ng mga de-kalidad na listahan ng customer na isinasaalang-alang ang parehong mga kumpanya at ang kanilang mga pangunahing empleyado. Nagbibigay ng mga komprehensibong profile ng kumpanya, kakayahang umangkop sa API nito, at maging ng mga kakayahan sa pag-export para sa mga layunin ng paggawa ng mga update, inilalabas ng Mattermark ang lahat ng mga paghinto. Ang mga negosyong gustong i-target ang kanilang outreach nang mas mahusay habang sinusubaybayan din ang mga resulta ng kanilang mga kampanya ay naninindigan na makakuha ng kaunti mula sa pag-sign up para dito.
361. Mga Fintechstartup
Ang FintechStartupsCo ay nagsisilbing isang uri ng aggregator na sumusubaybay sa kung gaano karaming iba't ibang kumpanya ang naitataas sa kanilang mga IPO. Gamit ang isang minimalist na disenyo na nagpapalipat-lipat sa pagitan ng mga tab na "mga startup" at "balita", ito ay isang mabilis at madaling paraan para sa mga mamamahayag na manatiling nasa tuktok ng mga balitang nakakalap ng pondo. Samantala, ang mga publisher na naghahanap ng mabilis na nilalaman at mabilis na mga kuwento ay naninindigan din na makakuha mula sa muling pagtingin sa kung ano ang inaalok ng site na ito.
362. Datafox
Kung sakaling hindi ibigay ng pangalan ang lahat, ang DataFox ay isang kumpanya na nagsusumikap na ibigay sa mga kliyente ng negosyo nito ang impormasyong kailangan nila para ma-maximize ang kanilang mga CRM at para sa pangkalahatan ay gumawa ng mga desisyong batay sa data. Nag-aalok ng mga serbisyong kinabibilangan ng conference at intelligence ng kumpanya, mga API, at mga signal ng kumpanya, ang kumpanyang ito ay epektibong one-stop shop para sa mga negosyong nag-aayos ng kanilang mga benta at outreach na trabaho. Maaaring gusto din itong tingnan ng mga digital publisher at content provider.
Ang OpenSpending ay isang libreng platform, na maaaring ma-access halos saanman sa mundo, na nagpapahintulot sa mga user na maghanap at suriin ang data sa pananalapi sa pampublikong domain. Para sa hindi nagha-hack na mga miyembro ng lipunan, ito ay isang makapangyarihang tool para sa paggunita at pagsusuri. Ang mga mamamahayag, sa partikular, ay maaaring gumamit ng OpenSpending upang makahanap ng mga kawili-wiling bagong insight at ituloy ang mga anggulo ng kuwento gaya ng direktang iminumungkahi ng kumpanya sa site nito. Bilang karagdagang bonus, ang mga mamamahayag ay kabilang sa mga propesyon na partikular na hinihiling sa forum.
364. ESPN Sports API
Hindi kuntento sa pagiging pinakasikat na sports channel sa cable, pinapalawak ng ESPN ang impluwensya nito sa coding at mga API. Sa Developer Center, nag-aalok ang site sa mga publisher ng kanilang pagpili ng ilang API na kinabibilangan ng mga tala sa pananaliksik, power ranking, draft pick, kalendaryo, at headline. Mayroong kahit isang API na naglo-load ng mga profile ng atleta, talambuhay, at istatistika sa lahat ng pangunahing sports. Ang mga mamamahayag na naghahanda na magsulat ng isang kuwento na may nilalamang pang-sports ay maaari lamang makinabang sa pag-browse sa mga ito.
Para sa mga mahilig sa palakasan na sumikat na gusto ang kanilang mga advanced na istatistika at mapagkukunan sa isang lugar, ang Sports Reference ay isa sa mga pinakamahusay na site sa web. Sa makasaysayang data na kinabibilangan ng mga istatistika ng koponan at manlalaro sa opensa at depensa, ang mga mananaliksik sa sports ay maaaring maging kasing lawak o kasingkitid hangga't gusto nila sa site na ito. Bilang karagdagan, mayroong mga numero para sa halos bawat pangunahing isport mula sa basketball hanggang baseball at hiwalay na data para sa iba't ibang sports sa kolehiyo.
Ang angkop na pinangalanang "Million Songs Collection" ay nagkakaloob ng buong 28 dataset na halaga ng metadata at impormasyon sa mga audio feature ng eksaktong isang milyong kanta. Karamihan sa resulta ng trabaho ng LabROSA ng Columbia University sa tabi ng Echo Nest, ang impormasyong ito ay naa-access at naka-host sa AWS system ng Amazon. Ang mga gumagamit ay maaaring magpatakbo ng mga paghahanap para sa impormasyon sa pamamagitan ng Infochimps na ginagawang mas naa-access para sa mga mamamahayag sa paghahanap ng mga hindi kilalang trivia pati na rin ang mga publisher ng nilalaman.