Existem muitos tipos diferentes de sites que fornecem uma grande variedade de dados gratuitos, freemium e pagos que podem ajudar desenvolvedores de público e jornalistas em seus esforços de reportagem e narrativa. A equipe da State of Digital Publishing gostaria de reconhecê-los, como derivados de pesquisas manuais e reconhecimento do nosso público existente.
1. Kaggle
Kaggle é um site que permite aos usuários descobrir o aprendizado de máquina enquanto escrevem e compartilham código baseado em nuvem. Baseando-se principalmente no entusiasmo de sua considerável comunidade, o site hospeda competições de conjuntos de dados para prêmios em dinheiro e, como resultado, contém enormes quantidades de dados compilados. Esteja você procurando dados históricos da Bolsa de Valores de Nova York, uma visão geral das tendências de produção de doces nos EUA ou códigos de ponta, este site está repleto de informações.
2. Wikipédia
É impossível ficar muito tempo na Internet sem ler um artigo da Wikipédia. Com artigos que variam de biografias históricas com fontes completas e referências a cronogramas de um futuro próximo e distante, é seguro dizer que a Wikipedia consolidou seu status como uma enciclopédia gratuita baseada na web. Entre a entrada que serve como uma visão geral do assunto e os muitos livros e referências online que o site oferece, a Wikipedia é a melhor amiga do escritor em muitos aspectos.
Como pode ser deduzido pelo nome do site, o Common Crawl pesquisa ou “rastreia” a web em busca de dados que armazena e constrói em um repositório aberto que os usuários podem acessar. Para dois exemplos do que é possível com este site, marcadores virtuais de patentes e listas abrangentes de sites que oferecem feeds RSS fornecem uma pequena amostra do quão poderoso é este aplicativo. Se houver dados ou comparações de sites que você deseja fazer, esta é uma ferramenta acessível para criar informações originais.
4. EDRM
EDRM, abreviação de Electronic Discovery Reference Model, é um site para profissionais jurídicos dedicados a compreender o potencial da descoberta eletrônica e as regras e expectativas em torno de como as informações são governadas. Além disso, os membros do EDRM trabalham juntos para desenvolver padrões colaborativos, software e ferramentas educacionais projetadas para promover os objetivos da comunidade. Para obter informações sobre as formas como a tecnologia pode e tem vindo a alterar os aspectos processuais e administrativos da prática jurídica, este é o site que pretende visitar.
5. Mahout
Mahout se concentra em um software de mesmo nome que tenta descobrir a logística de construção de um ambiente capaz de criar aplicativos de aprendizado de máquina de alto desempenho que podem ser dimensionados e criados rapidamente. Para pesquisadores que desejam compilar e manipular seus próprios conjuntos de dados ou experimentar aplicativos de aprendizado de máquina, este software é especialmente útil. Este site terá indivíduos no caminho certo para se tornarem proficientes com este software.
O Projeto Lemur é um banco de dados que tem como foco apoiar pesquisas na recuperação de informações e no manuseio de tecnologias da linguagem humana. Com páginas web com cerca de 1 bilhão e 10 idiomas coletadas de janeiro de 2009 a fevereiro de 2009, a enorme quantidade de material presente e de apoio torna-o um excelente recurso para pesquisadores. Entre tudo isso e o suporte adicional que pode ser encontrado no site, qualquer pessoa que tenha interesse em tecnologia e linguagens humanas terá muito com o que trabalhar neste site.
O Project Gutenberg é um diretório que apresenta romances, artigos e outras obras de domínio público. A coleção de mais de 54.000 e-books do site varia de materiais conhecidos, como Shakespeare, Mark Twain e Jane Austen, a obras menos conhecidas de nomes mais obscuros, como Henri Bergson e Samuel Butler. Seja pegando um romance clássico para ler bem ou fazendo pesquisas sobre como as pessoas viviam a vida no século XIX, o Projeto Gutenberg é um excelente recurso.
8. Conjunto de dados de um milhão de músicas
Este é um site que abriga um conjunto de dados completo contendo recursos de áudio e metadados de aproximadamente 1 milhão de músicas populares. Além do conjunto de dados principal de um milhão de músicas, há também vários conjuntos de dados com os quais a comunidade contribuiu em categorias relacionadas, como covers, rótulos de gênero e letras, entre outros. Historiadores musicais, amadores ou pesquisadores que desejam essas informações serão capazes de classificar os dados com relativa facilidade. Este pode muito bem ser o conjunto de dados mais extenso sobre este assunto em toda a Internet.
9. Amazônia
Todo mundo conhece a Amazon como um varejista digital, mas você sabia que a Amazon também hospeda conjuntos de dados públicos gratuitos que podem ser acessados por qualquer pessoa, sem precisar armazenar ou baixar nada em seus próprios dispositivos? Com dados que abrangem desde clima, ambiente espacial e informações meteorológicas até imagens focadas no desenvolvimento de algoritmos que auxiliam na visão computacional, não faltam opções para quem deseja uma maneira mais conveniente de analisar grandes quantidades de dados.
No interesse de promover mais transparência, envolver mais cidadãos e incentivar o diálogo, o Governo do Canadá oferece dados extensos como parte da sua iniciativa Governo Aberto. Neste site você pode encontrar conjuntos de dados sobre questões relacionadas ao governo, como os níveis de capacidade dos abrigos para moradores de rua no Canadá, bem como números regionais sobre os níveis de participação de anglófonos e francófonos no setor público. Com acesso a conjuntos de dados desta natureza, não há necessidade de depender das estatísticas de outras pessoas para encontrar informações.
Catálogos de Dados, agora Portais de Dados, oferecem aos usuários um site conveniente para navegar em portais de dados abertos de todo o mundo. Com os portais a serem avaliados e curados por vários níveis de governos, várias ONG e até pelo Banco Mundial, os dados disponíveis para análise são de qualidade extremamente elevada. Os usuários têm a opção de navegar ou contribuir com portais de dados. Do ponto de vista da pesquisa, a variedade de assuntos e informações torna este site um local especialmente conveniente para iniciar a busca por informações.
Data.gov.uk é um site que permite que indivíduos encontrem e acessem dados publicados por vários órgãos públicos, departamentos governamentais, autoridades locais e agências governamentais. Aqui os investigadores podem encontrar informações sobre o clima económico para pequenas empresas, comércio, importações, indústria e exportações ou mesmo fazer pesquisas sobre pagamentos superiores a £25.000 feitos por departamentos governamentais. Com o site afirmando explicitamente que os dados podem ser usados para pesquisas, as informações aqui abordadas podem até gerar mais ideias à medida que os pesquisadores as analisam.
Este site é onde o governo dos EUA fornece dados abertos aos quais o público pode ter acesso na forma de conjuntos de dados. Além dos dados brutos, o site também oferece uma série de ferramentas que podem ser usadas para fazer visualizações de dados, bem como construir aplicativos para web e mobile. Não se engane. Os dados são imensos, com informações que vão desde reclamações de cartão de crédito até dados de programas federais de empréstimos estudantis em mais de 197.000 conjuntos de dados. Este site oferece muitas oportunidades para inovação e análise abrangente.
DataSF oferece centenas de conjuntos de dados em relação à cidade e ao condado de São Francisco. Interessado em ver o que os lobistas locais e regionais têm defendido? Você precisa de estatísticas sobre o crime? Navegue pela guia Showcase para ver o que as pessoas realizaram com os dados ou use o formulário para fazer uma contribuição. Feito com dados abertos e oferecendo uma academia, um blog e uma série de outras ferramentas, este site é impulsionado em grande parte pela colaboração e pela comunidade. Isso o torna um trunfo para o pesquisador.
15. DataFerrett
DataFerrett é diferente de muitos sites porque não é um repositório ou diretório, mas sim uma ferramenta que permite aos usuários personalizar dados de fontes locais, estaduais e federais por meio de análise e extração de dados. Esta ferramenta permite aos usuários criar planilhas customizadas e abrangentes e depois transformar as mesmas informações em um mapa ou gráfico sem precisar baixar ou habilitar qualquer outro software. Organizar entradas massivas de dados e transformá-los em algo fácil de ler nunca foi tão fácil.
16. Inforum
Através da Universidade de Maryland, o Inforum disponibiliza ao público dados económicos dos EUA. Muitas agências governamentais dos EUA contribuíram para este site ao ponto de o site agora conter milhares de “séries temporais económicas”, como as chama, e estas contêm números sobre a produção industrial, índices de preços, estatísticas laborais e indicadores empresariais. Os dados estão disponíveis gratuitamente e podem ser acessados com um laptop ou desktop pessoal. Os pesquisadores que desejam dar uma boa olhada nos dados econômicos brutos têm um recurso no Inforum.
17. Europeia
De acordo com os números do próprio site, as coleções da Europeana representam um total de mais de 50 milhões de registos. Usando os conjuntos de dados selecionados aqui, os pesquisadores podem encontrar as informações que procuram em menos tempo. Os conjuntos de dados aqui incluem categorias como modelos 3D, mapas italianos da Primeira Guerra Mundial e até uma coleção de mais de 20.000 fotos históricas de museus lituanos, entre outros. Para pesquisas históricas gerais ou como ponto de partida para examinar os enormes registos da Europeana, este é um excelente recurso para se ter.
Além de sua cobertura ininterrupta de notícias e eventos de última hora, o Guardian também tem uma seção inteira dedicada a sinopses de dados. Os artigos aqui variam desde temas sérios, como a eficácia das políticas habitacionais sobre os sem-abrigo, até assuntos um pouco mais alegres, como quais países têm o maior número de vencedores de prémios Nobel. Jornalistas e pesquisadores não têm falta de informações deste site para usar em seus próprios projetos. Com a ajuda de uma pesquisa rápida, é possível encontrar dados sobre praticamente tudo.
19. Omnibus de Expressão Gênica
Hospedado pelo Centro Nacional de Informações sobre Biotecnologia, o Gene Expression Omnibus é um site que contém “dados genômicos funcionais públicos” que estão em conformidade com os padrões MIAME (Informação Mínima sobre um Experimento de Microarray). O site também aceita dados organizados ou sequenciados, ao mesmo tempo que fornece as ferramentas necessárias para localizar e baixar as informações. Os interessados em estudar genomas ou adquirir informações sobre o assunto terão aqui todos os dados de que precisam e mais alguns.
Há muito reconhecido por suas contribuições para a inovação e o progresso nos campos das ciências sociais, o Centro de Ciência de Dados Espaciais (CSDS) da Universidade de Chicago explora a próxima fronteira com sua incursão na análise espacial e na tecnologia. O trabalho da CSDS tem aplicações em praticamente qualquer campo que tenha de enfrentar espaço na abordagem das questões. Consequentemente, campos como a economia ambiental, a saúde pública e a criminologia beneficiaram-se destas aplicações. A dedicação do CSDS ao software de código aberto e à distribuição de suas informações tornam os dados fornecidos ainda mais acessíveis.
21. Konect
Através do uso de dados coletados pelo Instituto de Ciência e Tecnologias da Web da Universidade de Koblenz-Landau, KONECT (Koblenz Network Collection) oferece pesquisas realizadas no campo da ciência de redes e assuntos relacionados. O projeto usa uma série de ferramentas de análise de rede próprias para processar números e produzir gráficos e algoritmos desenhados. A KONECT hospeda então os resultados do seu trabalho analítico diretamente no site. Com mais de 200 conjuntos de dados para escolher, este é um recurso que vale a pena explorar.
MIdata é um site que atua como um repositório de dados que deveriam ser usados por dados de aprendizado de máquina. Esses conjuntos de dados podem variar desde uma compilação de expressões faciais humanas até tópicos mais científicos, como prever como as moléculas se ligarão. Com entradas divididas em categorias que oferecem acesso a dados brutos, tutoriais na seção de materiais e métodos, bem como tarefas e desafios de aprendizagem, este site permite aos pesquisadores analisar no repositório conjuntos de dados de interesse.
23. NASDAQ
A NASDAQ é uma bolsa de valores mundialmente famosa que há muito tempo é um excelente recurso para jornalistas e pesquisadores em busca de dados do mundo das finanças e dos negócios. Aqui você encontrará informações sobre IPOs, dados históricos de preços e as últimas notícias financeiras que tornam este site um destino on-line para dados financeiros. NASDAQ Composite também oferece opções de dados pagos para aqueles que desejam fazer uma análise mais profunda. Este é um recurso muito respeitado e bem estabelecido.
24. NASA
Desde a época da chegada à Lua, já toda a gente já ouviu falar desta agência governamental e das suas incursões no espaço sideral. O que interessa aos jornalistas, no entanto, é como a NASA também é uma fonte valiosa de dados por meio de seu Arquivo Coordenado de Dados de Ciências Espaciais. Aqui, os pesquisadores podem encontrar dados de missões científicas espaciais em categorias como astrofísica, recursos de imagem e heliofísica, entre outras. Além disso, também existem vários white papers disponíveis no site para acompanhar os novos dados enviados.
Socrata é um site que pega os dados governamentais disponíveis e os coloca em um formato que torna mais fácil para as pessoas analisarem, clicarem e encontrarem as informações que procuram. Projetado especificamente tendo em mente as necessidades de indivíduos não técnicos, como especialistas em políticas públicas, pesquisadores, empreendedores e cidadãos preocupados, o Socrata usa a nuvem para compilar dados de uma variedade de fontes. Para jornalistas que tentam compreender a eficácia de diferentes políticas, esta é uma plataforma útil.
26. Quandl
Quandle é um site que oferece principalmente dados econômicos e financeiros formatados pensando nas necessidades dos profissionais de investimento. Contando com mais de 500 fontes de informação de organizações credíveis como o CLS Group, a ONU, bancos centrais e Zacks, entre outros, para agregar os seus dados, esta fonte de dados é perfeita para investigadores e jornalistas que pretendem ter uma visão geral num relance. Graças ao complemento Excel do site, o acesso direto aos dados nunca foi tão fácil para os usuários.
27. Universidade Carnegie Mellon
A Carnegie Mellon University tem uma merecida reputação como uma excelente instituição acadêmica. O que muitas pessoas não sabem é que o StatLab da Carnegie Mellon é um recurso útil para jornalistas em busca de dados. Este arquivo de conjunto de dados inclui dados sobre questões como os salários dos jogadores norte-americanos da MLB em 1986, bem como dados projetados para uso na avaliação da precisão do software de estatísticas. Em troca de reconhecimento, esses conjuntos de dados estão disponíveis para uso público.
28. UCI
O Repositório de Aprendizado de Máquina UC Irvine, conhecido como UCI, é um site que armazena uma tonelada de dados interessantes que jornalistas podem usar. Lar de 394 conjuntos de dados até o momento em que este livro foi escrito, o site tem a vantagem adicional de ter uma interface fácil de pesquisar. Alguns dos conjuntos de dados mais populares incluem informações sobre “Reconhecimento de atividade humana usando smartphones”, vinho e marketing bancário, entre outros assuntos. Em troca da utilização de todos esses dados, o site apenas pede uma citação.
29. UCR
Se você é um jornalista que está pesquisando o desenvolvimento do aprendizado de máquina, a página Classificação/Clustering de séries temporais do UCR será uma excelente leitura. O site fornece um documento informativo útil que fornecerá todas as informações básicas que você precisa saber. Junto com uma visão geral do conteúdo das informações, o site também oferece a possibilidade de baixar os dados diretamente. Apenas lembre-se de usar o formato de citação solicitado pelo site se você usar esses conjuntos de dados.
30. Censo dos EUA
Precisa de estatísticas sobre a riqueza da população? Quer saber a distribuição exata de gênero em uma determinada área? O censo dos EUA é um site que tem todos esses dados e muito mais disponíveis para visualização pública. Classifique os dados por ano ou região e você poderá encontrar rapidamente as estatísticas que a maioria das pessoas nem sabia que foram incluídas no censo dos EUA da maneira que foram. Esses números foram disponibilizados em Excel e Microsoft Word como opções que tornam os dados ainda mais acessíveis aos jornalistas.
31. Wolfram Alfa
Wolfram Alpha é na verdade um mecanismo computacional que permite aos usuários inserir os dados que desejam saber e receber um cálculo. O mecanismo faz dados e análises estatísticas, química, datas e horas, e até palavras e linguística, entre outras coisas. Para usuários que estão tentando descobrir novas maneiras de lidar com dados, isso é especialmente útil porque é capaz de gerar novos cálculos com o pressionar de um botão. Os jornalistas, em particular, têm muito a ganhar se utilizarem isto como recurso suplementar.
32. Yelp
Acontece que o Yelp é mais do que apenas restaurantes e avaliações de negócios de usuários. Este site de avaliações orientado ao usuário também mantém um conjunto de dados que dá aos pesquisadores acesso a avaliações, dados de usuários e empresas para “fins pessoais, educacionais e acadêmicos”. Pelas contas da empresa, são 4,7 milhões de avaliações e 156.000 empresas em 12 áreas metropolitanas incluídas no conjunto de dados. Com esses números, os materiais e tendências que os pesquisadores poderiam descobrir nesses dados podem ser uma surpresa agradável.
33. Mundo de dados
Quer ter uma lista de páginas removidas do Facebook? O que você acha de poder classificar os dados econômicos dos EUA por condado? Data World é um site que permite que as pessoas compartilhem, hospedem, colaborem e acompanhem dados. O site ainda inclui uma seção para jornalistas que descreve as razões pelas quais o Data World é útil para os membros da profissão, ao mesmo tempo que aponta os recursos de hospedagem para um preditor FOIA simplificado, bem como páginas projetadas para ajudar na organização. Resumindo, esta é uma combinação sólida de dados e hospedagem de dados.
Administrado e operado pela CIA, o World Factbook fornece informações sobre as estruturas sociais, história, situação militar e econômica de 267 países, juntamente com mapas, bandeiras e um conjunto de fusos horários seguindo os materiais do mapa mundial. O site oferece uma visão completa e aprofundada do assunto de uma forma que vai além do básico. Em suma, esta é uma fonte de dados que deveria estar no arsenal de todo jornalista.
35. HealthData.gov
Gerido pelo Departamento de Saúde e Serviços Humanos dos EUA, HealthData.gov oferece ao público acesso a “dados de saúde de alto valor” na esperança de captar a atenção de empresários, decisores políticos e investigadores. Pelo menos nas áreas de desenvolvimento de produtos e serviços, as pessoas têm conseguido examinar esses dados e obter resultados. Jornalistas que desejam estar na vanguarda dos dados de saúde ou que estão examinando uma declaração divulgada por um funcionário da área de saúde podem usar este site para encontrar respostas.
36. UNICEF
Este é um site que confere credibilidade instantânea aos jornalistas que utilizam as informações que ele oferece. As estatísticas que o UNICEF cobre incluem aquelas relacionadas com questões de saúde e direitos humanos, como educação, saúde materna, pobreza infantil, água e saneamento e deficiência infantil, entre muitas outras categorias de estatísticas que são mantidas. É útil para pesquisadores porque está atualizado e é apoiado por uma das organizações mais conhecidas do planeta. Os jornalistas não podem errar ao citar esta fonte de dados.
37. Organização Mundial da Saúde
A Organização Mundial da Saúde é uma organização internacional que reúne estatísticas e informações de saúde em todo o mundo. Além das informações que podem ser encontradas diretamente na página inicial, o site também oferece dados do Observatório Global de Saúde. Estes dados incluem informações sobre os passos que os países estão a tomar em direcção aos cuidados de saúde universais, investigação e desenvolvimento em saúde, entre outras categorias. Os jornalistas encontrarão aqui muitas informações sobre surtos, emergências de saúde e cobertura de saúde de uma perspectiva internacional.
Com a disponibilidade dos dados públicos do Google, os jornalistas podem claramente confiar no Google de várias maneiras. O rolo compressor do mecanismo de busca tem dados públicos disponíveis para análise com mais de 100 conjuntos de dados públicos em seu nome. O assunto dos dados varia desde o extremamente sério, com Indicadores de Desenvolvimento Mundial e Indicadores de Desenvolvimento Humano, até ao interessante, com dados sobre as estradas mais perigosas da Europa. Tudo o que um pesquisador precisa fazer é fazer uma pesquisa e ver o que os dados públicos do Google possuem.
O Gap Minder oferece dados sobre vários indicadores locais e nacionais, juntamente com links e informações sobre todos os fornecedores de dados. Usando este site, os pesquisadores podem ver informações como a idade das mulheres quando se casam pela primeira vez, estatísticas sobre o consumo de álcool e causas de morte em crianças. Para jornalistas que escrevem com um cunho internacional ou que fazem dados comparativos, este é um excelente recurso. Esta é uma fonte útil de dados de qualquer maneira.
O Google Trends é uma ferramenta que fornece aos pesquisadores informações sobre o que as pessoas estão procurando neste momento. Os pesquisadores podem comparar os dados com as tendências que ocorreram no passado e também podem usar a ferramenta para fazer estimativas antes, por exemplo, da temporada de férias, para ver o que acontecerá nas pesquisas no futuro. As tendências do Google oferecem gráficos, tópicos importantes e muitas oportunidades para descobrir as notícias antes que sejam oficialmente noticiadas.
41. Google Finanças
O Google Finance oferece uma oportunidade rápida e fácil de fazer uma pesquisa mais aprofundada sobre uma empresa que tem entusiasmado os investidores. Maneiras fáceis de filtrar indicadores técnicos e revisar as últimas notícias sobre a empresa em uma janela simples e direta que permite classificar ainda mais as informações. Além disso, é grátis. Para jornalistas que desejam pesquisar as finanças de uma empresa negociada, o Google Finance oferece uma interface intuitiva para acessar essas informações. Infelizmente, o Google descontinuou recentemente alguns dos principais recursos, como o portfólio financeiro. Aqui estão algumas alternativas ao Google Finance .
42. DBpédia
Qualquer pessoa que já desejou uma maneira mais fácil de realizar pesquisas na Wikipédia tem motivos para estar entusiasmada com a DBpedia. Impulsionado pelo compromisso da comunidade, este site busca possibilitar a realização de pesquisas mais sofisticadas no conteúdo da Wikipédia. Com a versão em inglês apresentando 4,58 milhões de entradas com classificações e categorias associadas, o site está no caminho certo para oferecer uma cobertura abrangente baseada nas informações da Wikipedia. Os jornalistas não podem errar com esta fonte de dados.
Para muitos, a Pew Research está no escalão superior no que diz respeito a pesquisas, relatórios e dados de pesquisa. O site cobre tópicos que vão desde opiniões políticas até tendências sociais e desenvolvimentos em vários setores de trabalho. A Pew Research também possui uma função de pesquisa que torna o acesso às informações mais fácil do que nunca. Jornalistas que desejam estatísticas e descobertas atualizadas provenientes de uma fonte confiável e respeitável não podem errar ao recorrer à Pew Research.
44. Instituto Amplo
Para jornalistas que desejam saber as últimas notícias relacionadas ao câncer, os conjuntos de dados do Broad Institute podem ser o lugar perfeito para encontrar as informações. Isso também inclui informações sobre assuntos adicionais, como Bioinformática e Biologia Computacional, bem como câncer cerebral e descoberta de padrões moleculares. Em suma, este site dá aos jornalistas uma vantagem em termos de encontrar dados aprofundados sobre o cancro para fazer histórias a partir dos dados fornecidos pelo Broad Institute.
45. Dados da ONU
UNdata oferece informações sobre diferentes países ao redor do mundo. Isto inclui dados como indicadores técnicos, indicadores sociais e indicadores económicos para cada país envolvido. Para jornalistas que trabalham em histórias de interesse humano ou que poderiam beneficiar de serem fundamentadas por algumas estatísticas e dados adicionais, o UNdata é a escolha ideal. A precisão dos dados, bem como a reputação da ONU, fazem desta uma fonte de dados com a qual os jornalistas podem contar enquanto fazem pesquisas.
46. Google Acadêmico
Imagine se, em vez de percorrer sites, fosse possível acessar uma pesquisa que não tivesse nada além de artigos revisados por pares e materiais acadêmicos. O Google Acadêmico possibilita que as pessoas encontrem artigos de periódicos, white papers e publicações dos principais acadêmicos do mundo. Como normalmente acontece com esta empresa, o Google Scholar é o mais intuitivo possível, bastando ao usuário inserir uma palavra-chave para dar o pontapé inicial. A busca por trabalhos acadêmicos nunca foi tão simples.
47. Reddit
Conhecido mais comumente como “a primeira página da Internet”, o Reddit é um dos sites mais populares da Internet. Além de ser um medidor preciso do que está acontecendo online, o site também possui um subreddit, ou subfórum, dedicado também a conjuntos de dados. Os usuários podem solicitar conjuntos de dados, postar recursos e discutir sobre como trabalhar com dados por meio de formatos como JSON. Os pesquisadores ganham muito ao examinar essa fonte de dados.
48. Mercado de dados
O Qlik DataMarket possibilita coletar e manipular dados de fontes externas. Esta plataforma permite que os usuários façam empréstimos de vários conjuntos de dados com a opção de fazer referência cruzada com os dados que já possuem, a fim de refinar seu senso de contexto maior. Melhor ainda, mesmo sendo uma plataforma paga dependendo do assunto, também existe uma opção gratuita com o Qlik Datamarket. Os jornalistas que exploram os dados podem fazê-lo à vontade.
49. Hubspot
A Hubspot sempre foi uma líder inovadora em quem é quem no marketing empresarial. Do ponto de vista da pesquisa, este é um site que contará aos pesquisadores tudo o que está acontecendo na indústria, bem como o que as pessoas da indústria de marketing estão falando agora, em tempo real. Os jornalistas podem usar este site para saber mais sobre as tendências. Nesse sentido, o Hubspot é um ótimo recurso para pesquisadores.
50. Departamento de Estatísticas de Justiça
Talvez sem surpresa, o Bureau of Justice mantém uma tonelada de estatísticas. No site do Bureau você pode encontrar números sobre prisões, mortes de presidiários, execuções por pena capital, estatísticas de aplicação da lei e censos das prisões. O sistema de justiça criminal é um tema de constante fascínio tanto para o público como para as pessoas nele envolvidas. É isso que torna as estatísticas do Bureau of Justice ainda mais úteis para jornalistas que realizam pesquisas sobre o sistema de justiça criminal.
51. Relatório Uniforme de Crime
O Uniform Crime Report é uma coleção de estatísticas sobre crimes contra a propriedade e crimes violentos coletada pelo FBI. Embora as agências de aplicação da lei de todos os EUA tenham relatado esses dados desde 1930, as descobertas foram publicadas desde 1958 e podem pesquisar o arquivo . Os jornalistas que desejam explorar os dados criminais têm a opção de acessar e utilizar a ferramenta de dados UCR para explorar as informações disponíveis neste site.
52. Relatórios Uniformes de Crimes
O Uniform Crime Reporting é o resultado de um programa idealizado pela Associação Internacional de Chefes de Polícia em 1929. Os números aqui reunidos pelo FBI são publicados quatro vezes por ano. Além das informações fornecidas pelo programa UCR, o site também inclui relatórios sobre estatísticas de crimes de ódio, Policiais Mortos e Agredidos (LEOKA), bem como os resultados e números fornecidos pelo Sistema Nacional de Relatórios com Base em Incidentes.
53. NACJD
NACJD, ou Arquivo Nacional de Dados de Justiça Criminal, é um site que extrai informações de conjuntos de dados como o Uniform Crime Reports (UCR) e o National Crime Victimization Survey (NCVS) e depois armazena e distribui as estatísticas. Projetados para serem curados, armazenados e mantidos para máxima acessibilidade, os dados vêm em diversas formas, incluindo experimentais, qualitativas e longitudinais. Em última análise, isto oferece aos jornalistas e outros investigadores outra forma de visualizar e aceder às estatísticas da justiça criminal.
First Databank é um site que trata de dados sobre medicamentos. O site busca promover tomadas de decisão mais eficientes e baseadas em dados na área farmacêutica. Isto permite que médicos e clínicos comecem a pensar sobre medicamentos farmacêuticos de maneira diferente através do uso inovador da tecnologia do First Databank. Do ponto de vista profissional, este site é especialmente útil porque seus dados podem ajudar as equipes a se ajustarem à medida que novas informações chegam. No mínimo, este é um recurso útil para jornalistas que escrevem na área farmacêutica.
55. FDA
A FDA, conhecida como Food and Drug Administration, é a agência responsável por proteger a saúde pública por meio da supervisão e aprovação de medicamentos, produtos alimentícios, suplementos, vacinas e cosméticos, entre outros produtos de consumo. Como recurso, a FDA tem conjuntos de dados disponíveis para o público ler, ao mesmo tempo que fornece dados técnicos para pessoas que se sentem confortáveis em trabalhar com planilhas e analisar as informações provenientes dos conjuntos de dados. Este é definitivamente um recurso útil para jornalistas.
Já se perguntou quanto exatamente o país paga na sequência de uma epidemia de drogas? Existem rumores de pessoas consumindo drogas de maneira diferente de antes? Drugbase oferece um banco de dados repleto de estatísticas sobre as tendências e o uso de drogas nos Estados Unidos. Existem infográficos, bem como publicações sobre temas como comorbidade de dependência e doença mental ou fatos sobre dirigir sob efeito de drogas (não embriagado). Este é um recurso que fornece informações suficientes para identificar tendências e fazer comparações com dados anteriores.
57. UNODC
O UNODC, ou Gabinete das Nações Unidas contra a Droga e o Crime, tem um website dedicado à promoção do seu objectivo de ajudar os estados membros a adoptarem padrões mais rigorosos de investigação, recolha de dados e perícia. Neste site, os pesquisadores podem encontrar inúmeras estatísticas e publicações que cobrem assuntos como coleta de dados, análise de tendências e programas de pesquisa, sempre que possível. Um recurso repleto de informações sobre uma variedade de tópicos relacionados à ciência forense, bem como sobre a ciência do assunto.
58. Fatos sobre a Guerra às Drogas
Drug War Facts é um site que oferece ampla discussão sobre a guerra às drogas, bem como as consequências da política. Isto inclui estatísticas e números sobre detalhes como comparações entre o custo do tratamento em oposição ao custo de depender da aplicação da lei, em números sobre estimativas de despesas com o controlo das drogas, e uma série de informações sobre quase todos os tópicos relacionados com a guerra contra as drogas. Para muitas pessoas, este é o site mais completo da web no que diz respeito à guerra contra as drogas.
59. Centro Nacional de Estatísticas de Educação
O Centro Nacional de Estatísticas da Educação, muitas vezes referido como NCES, é o local ideal para obter todas e quaisquer estatísticas relacionadas com a educação. Este site contém estatísticas sobre a situação dos empréstimos estudantis, projeções de tendências educacionais, juntamente com conjuntos de dados e ferramentas de comparação que podem ser usadas para fazer análises mais aprofundadas. Os jornalistas podem utilizar este recurso para descobrir tendências, verificar declarações públicas, rever as publicações do Centro Nacional de Estatísticas da Educação e encontrar novas histórias nos dados.
60. Banco Mundial
O Banco Mundial acolhe numerosas estatísticas e dados compilados pelo Grupo de Dados de Desenvolvimento no sector financeiro, bem como na macroeconomia. É possível classificar os dados usando hashtags. Os utilizadores podem escolher entre uma variedade de indicadores e fazer uma seleção por país, a fim de analisar as diferentes medidas do progresso do desenvolvimento. Como tal, este é um recurso ao qual qualquer pessoa que analise a situação financeira e/ou económica dos países membros pode beneficiar de ter acesso.
61. Departamento de Estatísticas Trabalhistas
O Bureau of Labor Statistics é a fonte de referência dos jornalistas para obter números e estatísticas relacionadas às condições de trabalho atuais, ao que está acontecendo no mercado de trabalho, bem como à forma como os preços mudam e afetam a economia dos EUA. Com o trabalho estatístico da agência que remonta a 1884, não faltam dados económicos para os investigadores examinarem. O site armazena as informações em uma interface amigável e atualiza constantemente os dados disponíveis para pesquisa. Esta é uma fonte de dados que vale a pena explorar.
62. Os Números
Os lançamentos de grande sucesso recebem muita atenção da mídia, mas é difícil dizer até que ponto uma empresa realmente se saiu bem sem números. Digite “Os Números”. Este site oferece pesquisas e dados para a indústria cinematográfica e de entretenimento. Os pesquisadores podem explorar estimativas de receita, expectativas para lançamentos futuros e outros dados de investimento por meio da capacidade do mecanismo de busca baseado em SQL do OpusData. The Numbers é o primeiro lugar ou pesquisadores a visitar para obter estatísticas confiáveis sobre filmes e filmes. É isso que o torna um excelente recurso.
Film Forever é um site que os pesquisadores podem visitar para obter informações de mercado e dados da indústria cinematográfica no Reino Unido. Aqui, os usuários podem encontrar números semanais de bilheteria para os 15 principais lançamentos do Reino Unido, pesquisas de público, relatórios, estudos de caso e o principal Anuário Estatístico da organização. Além disso, o site também possui um calendário que mantém os telespectadores informados sobre quando serão divulgadas as próximas estatísticas. O nicho do Film Forever o torna uma fonte de dados particularmente valiosa.
64. IFPI
IFPI é um site que se orgulha de ter o controle da indústria fonográfica mundial. Os usuários encontrarão relatórios publicados repletos de insights sobre música gravada, dados de vendas nacionais e globais, bem como relatórios sobre o lado comercial da indústria musical que mostram como as empresas estão investindo na música. Esses relatórios permitem que os usuários vejam o que está acontecendo. Este site manterá os pesquisadores atualizados sobre o que está acontecendo na indústria musical em tempo real.
65. Estatista
Statista é um mecanismo de busca como o Google, só que em vez de páginas da web o site retorna dados e estatísticas. Com o simples apertar de um botão, os usuários podem obter acesso imediato a mais de um milhão de estatísticas e fatos. Os usuários encontrarão infográficos, estatísticas sobre a China, a indústria alimentícia, os mercados consumidores e, mediante pagamento de uma taxa, dossiês e relatórios do setor também estão disponíveis para visualização. Quer esteja à procura de informações sobre economia, redes sociais ou Big Mac, este é o lugar para o fazer.
66. EPA
A EPA, abreviação de Agência de Proteção Ambiental dos Estados Unidos, é a agência governamental responsável por proteger as pessoas e o meio ambiente, aplicando as leis que são estabelecidas e aprovadas pelo Congresso. No website da EPA, os utilizadores podem consultar uma série de conjuntos de dados sobre tópicos que vão desde a agricultura até assuntos tão restritos como publicações anuais sobre produtos químicos tóxicos e métodos de gestão de resíduos. Este site é uma excelente escolha para jornalistas que desejam acesso a dados ambientais brutos.
67. Centros de Controle e Prevenção de Doenças
Este site dos Centros de Controle e Prevenção de Doenças se autodenomina um “balcão único para dados ambientais de saúde pública”. Neste site, os pesquisadores encontrarão referências e listas de sistemas de dados que recebem fundos nacionais enquanto rastreiam e armazenam informações relacionadas a preocupações de saúde pública ambiental. Com foco em programas que operam em nível nacional e acessibilidade por meio de recursos de download direto, este é um recurso com o qual se pode contar para obter as informações mais recentes e precisas da web.
68. Centros Nacionais de Saúde Ambiental
Estabelecido após a fusão de três agências anteriormente independentes, os Centros Nacionais de Saúde Ambiental são o local ideal para obter informações de alta qualidade sobre o meio ambiente. Oferecendo dados abrangentes que vão desde dados oceânicos até registros de gelo de milhões de anos atrás, se o assunto envolver o meio ambiente, é provável que este site tenha informações sobre o assunto. O compromisso da agência com a precisão e a excelência na administração de um dos maiores arquivos do gênero também a torna um dos poucos sites online que possui, atualiza e mantém esse tipo de dados.
69. Serviço Meteorológico Nacional
O Serviço Meteorológico Nacional da Administração Oceânica e Atmosférica Nacional dirá aos pesquisadores tudo o que eles precisam saber sobre o clima. Este site oferece pesquisas de dados que incluem informações sobre categorias como avisos e previsões, clima, previsões geográficas e muito mais. Além disso, vem com um mapa intuitivo e fácil de seguir, com guias que podem ser clicadas para obter diferentes resultados. Seja analisando o que aconteceu localmente ou encontrando a previsão para uma cidade em um estado diferente, este site descobrirá informações rapidamente.
70. Wunderground
Wunderground é um recurso que se dedica a garantir que as informações sobre o clima estejam disponíveis para todos ao redor do mundo, prestando atenção também às áreas que não recebem muita cobertura. A Wunderground afirma explicitamente que tomou medidas para garantir que a experiência do usuário seja excelente em múltiplas plataformas digitais. Isso significa que o site pode ser acessado tanto por dispositivos móveis quanto por PC, tornando-o um recurso ideal para jornalistas em trânsito.
Weatherbase fornece informações sobre condições atuais, médias, informações climáticas e condições de viagem para mais de 40.000 cidades ao redor do mundo com a ajuda de uma barra de pesquisa simples. Use o site complementar ao qual o site está vinculado para encontrar informações adicionais sobre viagens, como conversores de moeda, coordenadas e informações do condado, entre outras curiosidades. O Weatherbase também pode ser usado para encontrar lugares para passar férias apenas com base em como estará o tempo. Boa pesquisa!
72. Atlas Energético
Publicado pela Agência Internacional de Energia, o Atlas Energético apresenta aos investigadores a capacidade de ver o mundo através de estatísticas energéticas. Originalmente concebido para ser uma fonte de dados complementar desde a sua criação original, o site apresenta um balanço energético de fluxo Sankey animado, bem como várias bases de dados para acompanhar as publicações que podem ser consultadas na página de estatísticas da Agência Internacional de Energia. Os pesquisadores acharão este site e seus sites complementares extremamente úteis ao pesquisar as maneiras pelas quais os países e as cidades usam a energia.
73. Gabinete de Análise Económica
O Bureau of Economic Analysis, ou BEA, abreviadamente, publica uma ampla gama de informações úteis que permitem aos investigadores manterem os seus proverbiais dedos no pulso da economia do país. Neste site, existem números sobre as contas económicas dos EUA que incluem números sobre gastos do consumidor, PIB e activos fixos, entre outros dados úteis. Os pesquisadores podem pesquisar por região ou setor, bem como por nível, com opções de pesquisa internacionais, nacionais e regionais. Experimente a página de dados interativa para saber mais sobre a agência.
74. Bureau Nacional de Pesquisa Econômica
O site do National Bureau of Economic Research, ou NBER, é uma fonte de dados que aborda a economia do ponto de vista analítico. Acolhe dados sobre uma vasta gama de tópicos económicos com entradas como o Índice de Governação Africana, o Ciclo Económico Oficial, Coincidentes Experimentais, Índices de Avanços e Recessão e a Base de Dados de História Macro. O NBER possui conjuntos de dados oficiais publicados e compilados em seu próprio nome, bem como índices compilados por outros editores.
75. Comissão de Valores Mobiliários dos EUA
A Comissão de Valores Mobiliários dos Estados Unidos é uma agência que atua como uma espécie de vigilante na promoção da transparência, justiça e eficiência nos mercados. Curiosamente, o site possui um conjunto de dados de demonstrações financeiras que data de janeiro de 2009 a outubro de 2017, com atualizações trimestrais. Os pesquisadores podem contar com este site para ficar por dentro das últimas notícias relacionadas aos registros e às informações que ele pode fornecer sobre as empresas e o estado de suas finanças.
76. FMI
O Fundo Monetário Internacional, também conhecido como FMI, é uma organização bem estabelecida no sector económico e financeiro internacional. No site, os pesquisadores podem encontrar uma série de dados sobre esses assuntos. Os usuários podem pesquisar conjuntos de dados por indicador e país e navegar nos gráficos e mapas enquanto fazem pesquisas. Os conjuntos de dados populares incluem a direção do comércio, os preços dos produtos primários, indicadores de solidez financeira, inquéritos e estatísticas financeiras internacionais, entre outros itens de informação valiosa.
Originalmente concebido em Harvard, o Atlas é uma ferramenta online que permite visualizar e interagir com a situação comercial de uma empresa. A Atlas irá então recolher as informações e propor diferentes produtos que o país poderia potencialmente fabricar para melhorar a sua economia. Esta é uma ferramenta utilizada por decisores políticos, empresários, investidores e membros do público empenhados que pretendem ter uma melhor compreensão do clima económico de um determinado país. As questões do comércio e das economias nacionais nunca foram tão acessíveis.
78. Fazendo negócios
Doing Business é o resultado de um esforço para fazer avaliações objetivas das regulamentações empresariais. O site examina cerca de 200 economias e inúmeras cidades, medindo detalhes como indicadores económicos, bem como classificando a facilidade de fazer negócios. Este site permite aos usuários examinar os efeitos de vários tipos de regulamentações comerciais entre países e hospedar relatórios, bem como extensos dados qualitativos. Além disso, o site também possibilita fazer comparações ao longo do tempo.
79. Camarada
Originalmente um projeto do Departamento de Negócios, Energia e Estratégia Industrial do Reino Unido em conjunto com o Departamento de Comércio Internacional, o Comtrade é um excelente recurso. Tomando emprestados dados do Comtrade Data das Nações Unidas, o site fornece aos usuários um gráfico interativo que pode ser usado para pesquisar, comparar e analisar os números exatos do comércio e das mercadorias entre os países. Basta selecionar o país declarante, escolher um país parceiro e fazer seleções, tanto quanto possível.
Os Dados Financeiros Globais são uma fonte que não apenas compila dados financeiros padrão, mas também coleta informações financeiras que datam de 1200 até agora. Essas informações são derivadas de uma variedade de fontes, incluindo livros, materiais arquivados, revistas acadêmicas e periódicos de notícias. Além disso, o site possui conjuntos de dados que utilizam o método estatístico de encadeamento. O resultado final, na perspectiva do usuário, é um recurso como nenhum outro na Internet em virtude de seus dados exclusivos.
Visualizing Economics é menos um recurso no sentido de descoberta de dados do termo e mais um serviço que se concentra no design de gráficos de informações e painéis interativos. Além disso, a Visualizing Economics também faz análises e projetos com o propósito expresso de tornar os dados econômicos mais fáceis de entender. Através deste site, os jornalistas têm uma oportunidade legítima de trabalhar com um profissional que tem anos de experiência na tradução de dados económicos em algo mais acessível ao público em geral.
82. Portal de dados abertos da UE
O Portal de Dados Abertos da UE é um projeto que foi criado na sequência de uma decisão tomada pela Comissão Europeia. Neste site, as instituições da UE oferecem dados para visualização e utilização públicas sem restrições de direitos de autor e disponíveis gratuitamente. Os conjuntos de dados incluem os dados de referência CORDIS, o registo de transparência e até uma lista completa das pessoas, entidades e grupos contra os quais a UE emitiu sanções financeiras. Além disso, os dados estão disponíveis em vários formatos digitais.
83. Rede de dados aberta
A Open Data Network é um site que permite aos usuários consultar dados por região e cidade. Ostentando uma página inicial clara e intuitiva no site, os pesquisadores têm a capacidade de pesquisar por categoria de dados, cidade e até mesmo por exemplos de perguntas. Em cada página, depois de passar pelas categorias de dados ou pelos exemplos de perguntas, há links convenientes para ainda mais conjuntos de dados. A organização dos dados por si só faz da Open Data Network um site que vale a pena explorar.
84. Landmatriz
O Landmatrix é um site que oferece um banco de dados online para negócios de terrenos com o intuito de promover mais transparência nas aquisições. Essencialmente, esta ferramenta pode ser usada para visualizar e dar sentido aos vários negócios de terrenos. Os dados estão sempre melhorando, mudando e sendo ajustados para melhorar a precisão das informações disponibilizadas. Até o momento, o Landmatrix possui informações sobre mais de 1.000 negócios. É uma fonte que vale a pena explorar para os pesquisadores.
85. Programa das Nações Unidas para o Desenvolvimento
O Programa das Nações Unidas para o Desenvolvimento contém muitos dados úteis sobre o desenvolvimento humano em todo o mundo para serem explorados pelo público. Com datas geralmente abrangendo de 1990 a 2015 em muitos destes conjuntos de dados, os índices incluem tabelas completas, como tendências no índice de desenvolvimento humano, o índice de desigualdade de género e a disparidade de género ao longo da vida. Os pesquisadores podem pesquisar os dados diretamente pela barra de pesquisa e também ir por país caso a intenção seja passar pelo gráfico.
86. OCDE
A OCDE, conhecida como Organização para a Cooperação e Desenvolvimento Económico, tem um site que se concentra em ajudar os governos em iniciativas anti-pobreza e na prosperidade através da estabilidade económica e do crescimento. Neste site, os pesquisadores encontrarão materiais revisados por pares, publicações, bem como padrões e argumentos a favor do estabelecimento de padrões. A OCDE também alberga um livro informativo que fornece uma sólida ferramenta de referência económica para acompanhar uma série de inquéritos e previsões sobre as perspetivas económicas que podem ser encontradas nas suas páginas.
87. Departamento de Saúde e Serviços Humanos dos EUA
O Departamento de Saúde e Serviços Humanos dos EUA opera um site que fornece informações sobre o Conselho Presidencial de Fitness, Esportes e Nutrição. Com fatos e dados compilados com o auxílio de diversos especialistas em áreas afins, como chefs e atletas. Além disso, o site também possui uma série de estatísticas. Os investigadores podem encontrar factos sobre a actividade física das crianças, os hábitos de fortalecimento muscular dos adultos, bem como informações sobre os hábitos alimentares do público, bem como a obesidade, entre inúmeros outros factos e estatísticas.
88. Parceiros no acesso à informação para a força de trabalho em saúde pública
Partners in Information Access for the Public Health Workforce é um projeto que surgiu como resultado de organizações de saúde pública, agências governamentais dos EUA e bibliotecas especializadas em ciências da saúde. As páginas de tópicos deste site incluem assuntos como subsídios e financiamento, promoção da saúde e educação em saúde, além de literatura e diretrizes. Na seção Tópicos de Saúde Pública, também há dados sobre assuntos como bioterrorismo, genômica da saúde pública e saúde pública odontológica, para citar alguns assuntos.
Nas últimas três décadas, a United Health Foundation tem fornecido informações sobre classificações de saúde para utilização como meio de medir a saúde pública. O site hospeda vários relatórios e publicações que incluem relatórios sobre a saúde daqueles que serviram, relatórios seniores, saúde de mulheres e crianças, relatórios anuais e até resumos sobre tópicos importantes para a área. Use o mapa interativo para explorar por região e obter mais informações. Há também uma barra de pesquisa para navegação adicional caso os pesquisadores estejam procurando por algo mais específico.
90. Medicamentos
Nos Estados Unidos, o Medicare é o principal meio de que muitas pessoas dependem para obter seguro saúde e acesso a tratamento médico. Juntamente com os serviços que oferece em tempo real, o Medicare também oferece dados sobre padrões e qualidade de tratamento em instalações e hospitais através do seu gráfico e regra de comparação. É o conjunto de dados oficial utilizado pelo site Hospital Compare e está repleto de dados que podem ser baixados no Excel para maior facilidade de acesso.
91. Vigilância, Epidemiologia e Resultados Finais (SEER)
Vigilância, Epidemiologia e Resultados Finais, também conhecido como SEER, possui um site especialmente útil como fonte de informações sobre estatísticas sobre câncer. Abriga resumos estatísticos que permitem pesquisas sobre os números associados ao câncer que podem ser classificados por localização do câncer, etnia, raça, idade, sexo e até mesmo por tipo de dados. O site também hospeda publicações, conjuntos de dados e software que podem ser usados por pesquisadores para análises ainda mais profundas.
A Amnistia Internacional é uma organização que há muito defende os direitos humanos e a justiça em todo o mundo. Acontece também que alberga muitos dados sobre a situação dos direitos humanos em todo o mundo, bem como informações sobre atrocidades e crimes específicos contra a humanidade em diferentes pontos, como parte do seu relatório anual. Os investigadores podem utilizar a informação para fazer comparações entre diferentes anos e para ver como diferentes países evoluíram ou regrediram na área dos direitos humanos.
93. Grupo de análise de dados de direitos humanos
Desde a sua criação, há 25 anos, o Grupo de Análise de Dados de Direitos Humanos tem aplicado princípios científicos às violações dos direitos humanos em diferentes países ao redor do mundo. O site hospeda publicações que foram publicadas em meios de comunicação de renome, como o Washington Post, e publicações formais das editoras Macmillan, classificadas por ano. Junto com suas publicações organizadas há anos, também havia projetos ocorrendo em todo o mundo. Para uma visão mais técnica das violações dos direitos humanos, esta é uma ótima pesquisa.
94. Dados de relações internacionais e direitos humanos
Este site hospeda bancos de dados compilados por inúmeras organizações, universidades e até agências governamentais de renome. Exemplos destes seriam o Projecto Manifesto, o Projecto Minorias (em Risco), o Distrito Comparativo dos Estados de Bem-Estar e a Base de Dados de Conflitos Armados. Existem alguns projetos como o Projeto Polity IV que remontam ao século XIX. Entretanto, projectos como o Instituto Internacional de Investigação para a Paz de Estocolmo (SIPRI) medem as transferências de armas, as despesas militares internacionais e as tendências de segurança. A melhor maneira de apreciar os dados seria acessar o site e explorá-los.
95. Programa de dados de conflito de Uppsala
O Departamento de Pesquisa sobre Paz e Conflitos de Uppsala, muitas vezes referido como UCDP, hospeda um enorme banco de dados chamado Enciclopédia de Conflitos UCDP. Este é um site que permite aos usuários clicar e explorar os dados que o departamento já desagregou. Os pesquisadores podem ser clicados no site e também baixados para posterior manipulação e análise. Este é um recurso com o qual se pode contar e referenciar para obter informações de qualidade distribuídas de forma acessível.
96. Departamento do Trabalho dos Estados Unidos
O Departamento do Trabalho dos Estados Unidos hospeda muitos dados económicos relativos a estatísticas sobre desemprego e emprego. Naturalmente, estes números incluem bases de dados que incluem estatísticas de despedimentos em massa, projeções de emprego, vagas de emprego e rotatividade no local de trabalho, estatísticas nacionais de emprego e até estatísticas internacionais de comparação do trabalho. O site fornece informações atualizadas e precisas enquanto o Departamento do Trabalho acompanha tudo. Este é um recurso confiável com apoio governamental para fins de pesquisa.
97. Administração de Pequenas Empresas
A Small Business Administration é há muito tempo um recurso comprovado para empreendedores e outros aspirantes a empreendedores. Este site hospeda uma série de estatísticas sobre emprego, bem como informações que permitem aos pesquisadores fazer pesquisas de mercado e análises competitivas. Aqui os pesquisadores podem encontrar números, estatísticas e ferramentas que podem ser usadas para descobrir dados adicionais. Para obter informações sobre estatísticas de pequenas empresas do ponto de vista do empregador e das empresas, este é um excelente recurso ao qual os jornalistas podem recorrer a qualquer momento.
98. Pacote coletivo
Crowdpac é uma plataforma que permite que candidatos políticos arrecadem e se organizem. Baseando-se fortemente na ideia de que há vários candidatos ao Congresso em cada eleição que basicamente correm sem oposição, este site permite que cidadãos engajados organizem apoio. Com artigos que discutem questões políticas relevantes, como gerrymandering, para acompanhar tópicos adicionais como direitos civis e segurança nacional, este site representa uma excelente oportunidade para compreender e descobrir o que está acontecendo na cena política de base.
99. Gallup
Este site abriga as famosas pesquisas Gallup. A Gallup é especializada em análises que permitem aos tomadores de decisão organizacionais resolver problemas por meio de uma abordagem baseada em dados para a resolução de problemas. Além disso, o dispositivo sugerido pela Gallup é frequentemente útil para soluções de condução. Esta é uma fonte que tem reconhecimento como padrão ouro em dados e análises avançadas. Basta navegar no site para explorar relatórios sobre tudo, desde a situação do local de trabalho global até a discussão sobre a produtividade dos EUA.
100. Biblioteca Central
A Biblioteca de Berkeley hospeda uma compilação completa de estatísticas e dados para pesquisas em Ciência Política em seu site. Nesta página, os pesquisadores encontrarão vários links que fornecem aos pesquisadores acesso a vários conjuntos de dados, bem como a capacidade de construir o seu próprio. Entre eles estão as Estatísticas Históricas dos Estados Unidos (HSUS), a Edição Millennial, o Data Planet, o ProQuest Statistical Insight e o Consórcio Interuniversitário para Pesquisa Política e Social. Há várias horas de dados para analisar.
Para quem não sabe, a RAND Corporation é uma organização especializada em pesquisas sobre desafios de políticas públicas. Com clientes e um portfólio que abrange todos os níveis de governo, a corporação é fonte de pesquisas de qualidade para tomada de decisões. A filial norte-americana da corporação hospeda um conjunto de estatísticas de banco de dados em seu site. Aqui os pesquisadores podem encontrar informações sobre educação básica, saúde, negócios e economia, entre outras categorias que abordam questões relevantes para o bem público.
102. Centro Roper para Pesquisa de Opinião Pública
Administrado e operado pela Cornell University, o Roper Center for Public Opinion Research é especializado na coleta, distribuição e preservação de dados de opinião pública. Como exemplo do tipo de informação que o Roper Center pode descobrir, os investigadores podem ter acesso aos dados das eleições nos EUA, bem como a um link para um arquivo de mais de 23.000 conjuntos de dados. Quer os jornalistas procurem a reacção do público à política ou a um recente susto de saúde, é quase certo que este site contém informações.
103. Governador de Transportes
Desenvolvido e operado pelo Bureau of Transportation, este site contém dados que abrangem uma ampla gama de assuntos relacionados ao transporte. Os recursos deste site incluem relatórios sobre energia, segurança dos passageiros, energia, desempenho do sistema, economia do transporte, infraestrutura e transporte de carga. Os usuários podem até classificar e acessar os dados oferecidos neste site por localização e geografia. Este é um site que permite aos pesquisadores descobrir tudo o que poderiam esperar saber sobre temas relacionados ao transporte.
104. Comércio de viagens
Travel Trade é um site que hospeda dados sobre saídas de cidadãos dos EUA que datam de 1996 a 2016 no momento da redação deste artigo. O objetivo declarado deste recurso é ajudar os membros interessados no processo do público em geral e compreender como o turismo global e o turismo internacional têm funcionado ao longo dos anos. Disponível tanto para download quanto para visualização online, esta é uma informação acessível. Os pesquisadores podem facilmente usar esses dados para encontrar tendências e fazer comparações.
105. Esquiar
Skift é um site que se concentra em fornecer inteligência e dados para a indústria de viagens. Entre outras fontes de dados, a empresa hospeda pesquisas, conferências e boletins informativos para assinantes e pesquisadores escolherem. Skift examina tópicos que os indivíduos do setor de viagens gostariam de saber, como para onde as pessoas viajam cada vez mais, identificação de novos mercados e muitas informações adicionais sobre tecnologia de viagens que os pesquisadores têm a opção de explorar.
106. Geoba.se
Geoba.se é o site perfeito para pessoas que desejam fatos e nada além de fatos sobre uma cidade ou local. Usando o mecanismo de busca na página inicial, encontrar coordenadas, informações sobre viagens, clima e até mesmo imagens de webcam locais com apenas alguns toques no teclado. O site também hospeda uma página que fornece informações sobre classificações mundiais que podem ser restringidas por região e país. Resumindo, este é um recurso que fornecerá dados e estatísticas puras.
107. Viagens nos EUA
A US Travel hospeda um site operado e mantido pelo Departamento de Estado dos EUA. A missão declarada do site é proteger a vida dos cidadãos norte-americanos que vão para o exterior. Como tal, esta fonte hospeda estatísticas, informações e relatórios sobre tópicos como passaportes dos EUA, vistos dos EUA, adoções internacionais, mortes no exterior e sequestros internacionais de pais e filhos. As informações podem ser usadas durante o planejamento de viagens, mas também podem ser usadas para identificar tendências de longo prazo com as estatísticas que abrangem de 1996 a 2016.
108. Serviço de dados do Reino Unido
Financiada pelo Conselho de Investigação Económica e Social, a recolha do UK Data Service publica uma vasta gama de dados. Este site contém informações que incluem materiais como dados de negócios, pesquisas internacionais, pesquisas patrocinadas pelo governo do Reino Unido e até dados do censo do Reino Unido. Basicamente, o site foi desenhado pensando nas necessidades de estudantes e pesquisadores. Além disso, existem guias, recursos e instruções que oferecem guias e recursos que ajudarão os pesquisadores a compreender e usar as ferramentas deste site rapidamente.
109. Data.gov.au
Administrado e publicado pelo governo australiano, o Data.gov.au oferece fácil acesso e pesquisa de dados abertos. Este site aponta explicitamente que os dados do governo podem ser usados para desenvolver ferramentas e aplicações que, por sua vez, podem ser usadas em benefício dos australianos. Não só é fornecido acesso aos conjuntos de dados abertos, mas também há dados não publicados que podem ser acessados mediante o pagamento de uma taxa. Para pesquisadores que desejam realizar uma análise ainda mais aprofundada, o site também oferece um Data Toolkit.
110. Twitter
Todo mundo conhece o Twitter por suas conversas rápidas, mensagens curtas e seu status na cultura popular como um centro de notícias de última hora. O que muita gente não sabe, porém, é que o Twitter também possui ferramentas para desenvolvedores que facilitam a filtragem e a descoberta de informações. Essas ferramentas permitem até que os pesquisadores visualizem tendências e filtrem por geografia. Seja lendo sobre hashtags populares ou explorando as ferramentas para desenvolvedores, o Twitter é um recurso que os jornalistas já usam há algum tempo.
111. Instagram
O Instagram não serve apenas para curtir fotos fofas de gatos e fotos adoráveis de bebês. Ou pelo menos não precisa ser. O aplicativo possui um conjunto surpreendentemente sofisticado de ferramentas de desenvolvedor que facilitam a compreensão e a pesquisa do público. Além disso, as hashtags e as pistas reveladas pelas fotos que as pessoas postam, bem como os indivíduos que são marcados nelas, podem ser um tesouro de informações. O Instagram é uma forma útil de descobrir o que é tendência em diferentes setores.
112. Quatro Quadrados
Para o tipo de pesquisa em que a localização é importante, o Four Square é uma fonte de dados útil devido ao seu enorme banco de dados e a todas as informações que compilou. Superficialmente, possui um guia da cidade que fornece recomendações aos usuários sobre os pontos fortes da comunidade. Four Square também possui ferramentas de desenvolvedor que permitem acesso a informações adicionais por meio do Places Database. Os jornalistas podem usar isso para saber mais sobre locais específicos e sobre as pessoas que usam o aplicativo.
113. New York Times
Considerado por muitos um membro estimado do Quarto Poder, são poucos os jornalistas que nunca ouviram falar do New York Times. O que muitas vezes é esquecido, entretanto, é o uso do New York Times como fonte de dados por meio de sua API. Os pesquisadores podem encontrar artigos que datam de 1851 por mês, pesquisar artigos e até mesmo encontrar resenhas de livros. Esta API permite pesquisar com base em visualizações, compartilhamentos e e-mails e até mesmo localizar e acessar comentários.
114. PA
A Associated Press tem um lugar permanente na cultura popular como fonte de notícias oportunas e precisas. Graças às suas ferramentas de desenvolvimento, é também uma fonte útil de dados para jornalistas. No momento em que este artigo foi escrito, os pesquisadores podem usar essas ferramentas para criar suas próprias edições enquanto baixam fotos e vídeos. O nível de conteúdo parece depender do tipo de plano que os pesquisadores estão usando, mas mesmo assim a API da Associated Press permite que os usuários levem o processo de pesquisa a outro nível.
115. Cinco Trinta E Oito
Os jornalistas podem já estar familiarizados com Nate Silver e Five Thirty Eight e seu modelo estatístico devido às suas previsões às vezes inesperadas, mas geralmente corretas. Five Thirty Eight tem um GitHub que hospeda conjuntos de dados, bem como códigos que foram usados ao longo da história do site. Os conjuntos de dados apresentam assuntos divertidos, como dados sobre maus motoristas, os Vingadores e a pesquisa sobre etiqueta de voo. Ao mesmo tempo, também existem arquivos que abordam questões um pouco mais sérias, como segurança aérea e crimes de ódio.
116. IMDB
O IMDb é considerado por muitos o site mais completo da web no que diz respeito à indústria cinematográfica e de atuação. Se houver um filme sendo lançado e as pessoas quiserem saber quem está atuando nele ou ver a reação geral do público que vai ao cinema, é provável que cheguem a este site em algum momento durante a pesquisa. A IMDb também hospeda vários conjuntos de dados que são atualizados todos os dias e estão disponíveis para uso comercial e não comercial.
117. KAPSARC
KAPSARC é um portal de dados que hospeda um total de 923 conjuntos de dados com informações específicas sobre dados energéticos. Esses conjuntos estão divididos em alguns temas gerais sobre uso de energia, fornecimento de energia e outros fatores relevantes, como políticas, demografia, meio ambiente, comércio, água e informações econômicas. Para pesquisadores interessados em energia e em como ela é usada em diferentes indústrias e setores, o KAPSARC é uma das fontes de dados de energia mais abrangentes da web.
118. Macro de ativos
Asset Marco é um site que fornece dados financeiros históricos e indicadores macroeconômicos. Esses dados abrangem mais de 75.000 ações, moedas, commodities e títulos em todo o mundo. Além disso, o site possui mais de 120.000 indicadores macroeconômicos que os usuários podem usar para explorar os dados financeiros de diferentes países. Além de todos esses dados do mercado financeiro, o site também aborda estratégias de investimento. Esta fonte é única devido ao grande volume de informações que pode ser encontrada.
119. Serviços Web do governo dos EUA e fontes de dados XML
Os serviços Web do governo dos EUA e as fontes de dados XML estão hospedados em um site chamado USGovXML.com. Aqui, os usuários podem navegar pelas diferentes fontes de dados XML e serviços da web fornecidos pelo governo dos EUA. Este simples ato de preservação mantém essas fontes da web transparentes e acessíveis ao público. Para pesquisadores que monitoram regularmente esse índice em geral, é possível encontrar uma história nos dados caso haja uma mudança repentina nos dados XML.
120. Figshare
Figshare é um site que hospeda mais de 5.000 peças de conteúdo científico disponíveis para pesquisa acadêmica e citação. Além das informações ali contidas, o site foi projetado para oferecer aos pesquisadores um único local para fins de compilação, upload, armazenamento e gerenciamento das pesquisas que encontrarem. Matemática, ciências da saúde, engenharia, química, ciências biológicas e ciências sociais, todas listadas como categorias em destaque. Este site é uma ótima fonte para jornalistas em busca de mais recursos acadêmicos para o site.
121. Dados vinculados
LinkedData é um site dedicado à ideia de encontrar novas maneiras de conectar dados da Internet que não estavam vinculados antes. Aqui, os usuários encontrarão tutoriais, guias e conjuntos de dados que darão início à história. Todos os conjuntos de dados se concentram no tópico de envolvimento com a comunidade de dados vinculados e, além da lista de compras de dados vinculados, a maioria é categorizada como URIs desreferencáveis, com ou sem o formato RDF complementar. Para saber mais sobre esta comunidade, este site é imperdível.
122. O mineiro da web
O Web Miner é o lugar perfeito para pesquisadores que desejam coletar todos os dados genéricos que encontrarem com o programa. Este site hospeda bancos de dados de exemplo, como restaurantes dos EUA, códigos SWIFT de bancos de todo o mundo, postos de gasolina dos EUA, atrações turísticas americanas e aplicativos do Google Play, entre outras listas enormes. No mínimo, é um site que tornará mais fácil e rápido para os jornalistas filtrar e descobrir grandes quantidades de dados em muito menos tempo.
123. Centro de dados
O Data Hub se orgulha de ser um lugar onde os usuários podem encontrar e publicar dados da maneira mais rápida e eficiente possível. O próprio site hospeda vários conjuntos de dados. O Índice de Preços de Casas (Case-Shiller), o preço mensal do ouro e as Tendências Atuais do Dióxido de Carbono Atmosférico são os três mais populares. Além dos dados, o site também hospeda uma série de tutoriais que os usuários podem seguir para aprender mais sobre como navegar nos diversos tipos de dados disponíveis.
124. Enigma Público
Em seu site, a Enigma Public se autodenomina “a mais ampla coleção de dados públicos” disponível na web. Os conjuntos de dados se enquadram em uma das quatro categorias amplas: FOIA, Essentials, Newsworthy e Under the Radar. Alguns dos dados neste site incluem salários de funcionários da Casa Branca e licenças federais ativas de armas de fogo. Após fazer uma conta gratuita, os usuários podem acessar qualquer uma das categorias de dados que estão disponíveis para visualização.
125. Yahoo
A maioria dos usuários da web está familiarizada com o nome Yahoo devido a nomes como Yahoo! Notícias e Yahoo! Financiamento entre as diversas propriedades online da empresa. De interesse para pesquisadores e jornalistas é o fato de o Yahoo também hospedar um grande número de conjuntos de dados, incluindo o Yahoo! Classificações de usuários musicais de músicas com meta informações de artista, álbum e gênero, v. 1.0 e Yahoo! Avaliações de usuários de filmes e informações descritivas de conteúdo, v.1.0, para citar dois. Jornalistas em busca de novas estatísticas não podem errar com esta fonte.
126. 1000 genomas
1000 Genomas abriga um projeto de mesmo nome que durou de 2008 a 2015. O objetivo do projeto era encontrar todas as variações genéticas que pudessem ocorrer em pelo menos 1% das populações estudadas. Junto com as publicações que surgiram por causa deste projeto, havia também enormes conjuntos de dados que incluíam bancos de dados separados de células variantes, arquivos de sequência bruta e disponibilidade de amostras. Esses dados podem ser navegados ou baixados.
127. CBOE
CBOE é uma bolsa de futuros que se concentra principalmente em futuros de volatilidade. Em particular, o site apresenta muitos materiais sobre os futuros que são apresentados no Índice de Volatilidade, marca registrada do site. O site hospeda dados de mercado de todos os tipos, incluindo dados históricos, estatísticas diárias de mercado e preços de liquidação diária de futuros VX. Para jornalistas que buscam dados de mercado de qualidade, o CBOE é um site que pode fornecer essas informações em um formato fácil de acompanhar e entender.
128. Fed de São Luís
O Federal Reserve Bank de St. Louis é um dos, senão o mais importante, centros financeiros de sua região. No site, os pesquisadores podem ler diretamente documentos de trabalho, dados econômicos, publicações e serviços de informação. Por outras palavras, não faltam informações sobre o pensamento actual e passado do Fed de St. Louis em termos de política, bem como sobre a capacidade de avaliar a eficácia do Banco da Reserva Federal de St. Louis. Para jornalistas de negócios, finanças e economia, este é um recurso de informação de primeira linha.
129. OANDA
A OANDA é uma popular plataforma de negociação de ações online, principalmente negociando CFDs e Câmbio. Além dos muitos recursos adicionados ao trader com a intenção de atrair traders online, a OANDA também hospeda muitos dados históricos de taxas, bem como informações históricas sobre o conversor de moeda no site. Junto com todos esses dados, o site também oferece informações com estratégias de investimento, além de novidades e análises de mercado. Nem é necessária uma conta para acessar a maioria desses dados.
130. ABS
O Australian Bureau of Statistics, ou ABS, não muito diferente do seu homólogo americano, oferece dados objectivos, informações económicas e investigação sobre uma vasta gama de tópicos que são relevantes para o país. Diretamente no próprio site, os pesquisadores podem consultar dados estatísticos sobre indicadores de negócios, saúde, habitação, finanças, comércio internacional, habitação, saúde mental, além de índices de preços e inflação. Os jornalistas podem realizar pesquisas para encontrar pesquisas e informações mais antigas que também podem classificar as informações por região.
131. Banco de dados de Londres
Originalmente concebido e operado pela Autoridade da Grande Londres, o Banco de Dados de Londres é a tentativa de Londres de tornar os dados de Londres mais acessíveis ao público. O objetivo final é dar às pessoas acesso a essas informações e, ao mesmo tempo, incentivá-las a usá-las gratuitamente da maneira que desejarem. Neste site, os usuários podem pesquisar dados por tópicos como Artes e Cultura, Crime e Segurança Comunitária, Educação e Saúde. Jornalistas interessados neste tipo de dados agora podem obtê-los diretamente do governo local.
132. Estatísticas da Nova Zelândia
O governo da Nova Zelândia hospeda uma tonelada de estatísticas e dados para os pesquisadores aprofundarem e analisarem neste site. Essas informações podem ser pesquisadas na barra de pesquisa na parte superior, filtrando por localização e região, bem como por tópico. Alguns dos tópicos incluem indicadores econômicos, saúde, renda e trabalho, setores industriais, meio ambiente e negócios. Entre as fontes de notícias adicionais e os comunicados que destacam várias descobertas e estatísticas, os jornalistas descobrirão todos os tipos de estatísticas específicas da Nova Zelândia através deste site.
133. Departamento de Meteorologia do Governo Australiano
Administrado e operado em última instância pelo Governo da Austrália, o site do Australian Bureau of Meterology apresenta informações meteorológicas relacionadas às várias cidades e regiões da Austrália. De acordo com o site, esta agência foi criada como um meio de ajudar os australianos a lidar com o clima que os rodeia através de uma combinação de avisos e conselhos. Aqui os pesquisadores poderão encontrar perspectivas sazonais, armazenamento de água, previsões de precipitação, variabilidade climática e previsões sazonais de vazões. Neste site você encontrará cobertura precisa e confiável sobre o clima australiano.
134. Lente de grupo
Este site é uma cortesia do GroupLens do Departamento de Ciência da Computação e Engenharia da Universidade de Minnesota. O site oferece publicações, bem como conjuntos de dados para fins de pesquisa. Há um total de cerca de seis conjuntos de dados. Entre os conjuntos nomeados, haveria alguns intitulados Book-Crossing, MovieLens e HetRec 2011. Em suma, este é um recurso útil para jornalistas que procuram compreender melhor como utilizar os dados fornecidos.
135. Pepitas KD
KD Nuggets é um site que se concentra principalmente em fornecer às pessoas ciência de dados, análise de negócios, aprendizado de máquina e mineração de dados. Há uma página no site que tem uma lista completa de conjuntos de dados que as pessoas usam para fazer mais exploração de mineração de dados e big data com conjuntos de dados como Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett e Datamob, todos vinculados. Este é um recurso fantástico para jornalistas que preferem ter todas as informações em uma página.
137. Microsoft
Todo mundo que já usou um PC ou laptop provavelmente já ouviu falar da Microsoft, pelo menos de passagem. Curiosamente, além de PCs, laptops e software, a Microsoft também hospeda muitas pesquisas e publicações. Isto inclui avanços como a busca da empresa para criar máquinas alfabetizadas, bem como ciência de dados baseada em nuvem. Há também informações adicionais sobre ferramentas que a Microsoft está desenvolvendo, como Visual Studio Code Tools e os desenvolvimentos em IA que elas representam.
138. RDataMineração
Exatamente como diz na lata, R Datamining é um recurso em R e datamining. O site fornece vários exemplos e documentos que fornecem uma perspectiva aprofundada sobre mineração de dados e mineração de dados com R. Além disso, também há links para cursos de treinamento, como o minicurso oferecido pela Universidade de Canberra. Isso inclui links para conjuntos de dados e apresentações gratuitos, bem como conjuntos de dados que cobrem assuntos como dados de aviões, companhias aéreas e rotas, bem como links para sites como o GeoDa.
139. Pesquisa Colaborativa em Neurociência Computacional – Compartilhamento de dados
A Pesquisa Colaborativa em Neurociência Computacional, também conhecida como CRCN, possui vários conjuntos de dados que podem ser acessados por meio de seu site. Os conjuntos de dados são categorizados pelas várias partes do cérebro, como o córtex visual, o hipocampo, o córtex motor, as aves, os movimentos oculares e a aplysia, como apenas alguns exemplos. Essas pastas também incluem desafios, ferramentas, simulações e métodos. A capacidade de compartilhar esses dados torna-os um recurso ainda melhor para uso em pesquisas.
140. Arquivo do banco de dados de proteínas
De acordo com seu site, o arquivo do Protein Data Bank tem sido um recurso de primeira linha sobre ácidos nucléicos, estruturas 3D de proteínas e montagens complexas desde 1971. Formado com a missão explícita de manter essas informações em domínio público, os pesquisadores podem acessar aqui para ver a validação relatórios e dicionários de dados on-line. Há também crescimentos de dados e estatísticas de uso disponíveis para classificação e análise baseadas na Web, bem como para download. O melhor de tudo é que o site está sempre acrescentando novas informações.
141. O Projeto PubChem
O PubChem, como projeto oficial, foi concebido com o objetivo de informar o público sobre o que pequenas moléculas são capazes de fazer do ponto de vista biológico. O site está vinculado a três bancos de dados, incluindo PubChem Compound, PubChem Substance e PubChem BioAssay. Além disso, o site também possibilita a busca de semelhanças entre diferentes proteínas. Para pesquisadores que levam sua análise de dados para o próximo nível, o site também oferece dicas e codificação gratuitas.
142. Coremine Médica
Coremine Medical é um recurso inestimável para quem procura informações sobre biologia, saúde e medicina. Agora que a capacidade de mineração de texto biomédico do PubGene foi implementada em sua forma atual, o Coremine também é uma das fontes mais flexíveis de informações biomédicas do mercado. Este site exibirá links entre conceitos e ideias em um formato visualmente atraente e de fácil compreensão, que de outra forma não teria sido notado. É facilmente uma das fontes de dados biomédicos mais abrangentes disponíveis para jornalistas.
143. Tu Tiempo
Tu Tiempo é uma fonte incrível de dados meteorológicos e climáticos para todos os países do mundo. Usando este recurso, é fácil encontrar médias anuais, mensais e diárias para praticamente todas as cidades e regiões do mundo. Além disso, os usuários também podem pesquisar no banco de dados de mais de 115 milhões de registros repletos de dados históricos que qualquer pessoa pode pesquisar. Dependendo da região pesquisada, é possível encontrar dados que remontam a 1929.
144. Recursos de rede complexos
Este é um site que fornece acesso a uma grande parte dos dados que foram usados pela primeira vez em seus experimentos baseados em computador. A lista completa de conjuntos de dados que listam os tipos de dados, incluindo gráficos de notícias, gráficos biológicos, gráficos de citações, gráficos de colaboração, gráficos projetados e gráficos semânticos. A página também contém links para uma lista de fontes que contém muitas informações, como o conjunto de dados que examinou cerca de 3 milhões de patentes nos EUA. A página também apresenta uma compilação impressionante de conjuntos de dados de redes complexas.
145. Escopo
Scopus é uma ferramenta que permite aos indivíduos encontrar pesquisas e citações acadêmicas de forma rápida e fácil. O site oferece um banco de dados incrivelmente extenso de pesquisas que ocorreram em todo o mundo em diversos campos que incluem setores como medicina, tecnologia, ciências sociais e artes e humanidades. Use o Scopus para capturar fontes acadêmicas que podem ter sido esquecidas. Afinal, em muitos círculos, a qualidade de uma fonte acadêmica pode ser quase tão importante quanto a informação que ela fornece.
146. Stanford
A reputação de Stanford como uma instituição acadêmica de prestígio não aconteceu do nada. A excelência transparece em seus cursos relacionados à programação. O site também hospeda vários conjuntos de dados que incluem detalhes como informações de redes sociais. Existem conjuntos de dados centrados nos círculos sociais do Facebook, solicitação de administrador da Wikipedia, círculos sociais do Twitter e Google +. As redes de comunicação e a Amazon Product Network também possuem seus próprios conjuntos de dados.
O Departamento de Ciências da Informação da Universidade de Milão administra e opera uma página da web conhecida como Laboratório de Algoritmos da Web. Este site é o lar de muitos conjuntos de dados que estão disponíveis para serem explorados. Estes incluem gráficos em relação às redes sociais, gráficos do Facebook, instantâneos do projeto DELIS e uma pequena lista de dados diversos. A informação aqui disponível pode ser visualizada online e descarregada se assim o desejar, tornando este um dos conjuntos de dados mais acessíveis do género na web.
148. Repositório de dados da rede UCI
O UCI Network Data Repository é um site dedicado a adotar uma abordagem científica para o estudo de redes. Na página de recursos, os pesquisadores encontrarão links para diretórios de conjuntos de dados selecionados por organizações e grupos de pesquisa, bem como por indivíduos. Ele também possui uma coleção de conjuntos de dados que normalmente seriam usados para análise de mídia social. Aqueles que se aprofundarem nos dados ficarão satisfeitos em descobrir que esses conjuntos também estão disponíveis para download.
149. CAIDA
O CAIDA, ou Centro de Análise Aplicada de Dados da Internet, recolhe uma vasta gama de dados de vários locais diferentes, muitas vezes com a assistência de diferentes organizações e indivíduos. Existem conjuntos de dados hospedados neste site, como AS Relationships, DDOS Attacks, Telescope e seus relacionados, juntamente com outros dados. As categorias incluem tráfego, topologia, segurança, resumo de worm e estatísticas de resumo de tráfego. Os conjuntos de dados podem exigir acesso de solicitação, mas muitos, se não a maioria, são públicos.
150. Crawdad
Crawdad, ou Community Resource for Archiving Wireless Data At Dartmouth, é único devido ao seu foco no fornecimento de dados sem fio a pesquisadores e outras pessoas que possam ter interesse no assunto. O site oferece uma série de ferramentas, bem como acesso a vários conjuntos de dados. Entre os conjuntos listados estão aqueles referentes ao uso educacional, caracterização de erros de bits, diagnóstico de rede, conectividade oportunista, computação com reconhecimento de localização e muito mais para selecionar. Os pesquisadores apreciarão este recurso quanto mais se aprofundarem nele.
151. Administração de Informação de Energia dos EUA
Muitas vezes referida como EIA, a Administração de Informação sobre Energia dos EUA tem como actividade fornecer dados anuais dos serviços públicos de electricidade ao público. As informações contidas nestes dados abrangem estoques de combustíveis fósseis, consumo de combustível, informações mensais e anuais sobre a geração de eletricidade e dados ambientais, entre outras opções. Os dados estão lá e disponíveis para análise desde os anos de 2001 a 2017. Basta o pesquisador navegar até o site e baixar as informações.
152. Dados Oceanográficos Britânicos
Financiado pelo Conselho Nacional de Pesquisa Ambiental, os Dados Oceanográficos Britânicos são uma das fontes de dados marinhos mais acessíveis na Internet. Com um extenso banco de dados que aborda correntes, perfis CTD, dados internacionais do nível do mar, correntes e até mesmo dados históricos do registrador de pressão inferior. Além disso, existem conjuntos de dados que podem ser encontrados na Biblioteca de Dados Publicados, que oferece acesso adicional ao catálogo. Esta é possivelmente uma das mais extensas fontes de informação marinha disponíveis online.
153. Fato
A Factual fornece dados de localização para publicidade e para uso em plataformas móveis. De particular interesse para os pesquisadores são as ferramentas de desenvolvedor que incluem o Engine Mobile SDK e os aplicativos profissionais e de pesquisa completos do Observation Graph, bem como a Local Validation Stack. Com um nome de site que enfatiza a paixão da empresa em levar dados ao redor do mundo e encontrar novas maneiras de colocá-los em contexto, a Factual tem um compromisso claro com os dados e em encontrar oportunidades novas e pouco ortodoxas para usá-los.
154. Áreas Administrativas Globais
Áreas Administrativas Globais é um geodatabase que mostra onde estão situadas as diversas áreas administrativas do mundo. Os dados recolhidos deste tipo de base de dados são normalmente utilizados em sistemas de informação geográfica. Estes incluiriam países e estão divididos em províncias, condados e departamentos, entre outros. A boa notícia para os jornalistas é que todos esses dados estão disponíveis gratuitamente e também podem ser usados para uso acadêmico e geral não comercial.
155. Geonomes
Geonames é um site que abriga um banco de dados geográfico com milhões de entradas, recursos exclusivos e nomes alternativos. Oferecendo opção de exportação e acesso por meio de diversos serviços web, este é um banco de dados que processa aproximadamente 150 milhões de solicitações por dia. Graças aos recursos wiki do banco de dados, os usuários podem fazer ajustes e alterações nas entradas do banco de dados com relativa facilidade. Este é um ótimo recurso apenas para recursos de hospedagem multilíngue.
Natural Earth Data é um conjunto de dados de mapas disponível em domínio público e repleto de informações projetadas para uso em software de elaboração de mapas para a criação de mapas de última geração. O visual do produto final é limpo e bem organizado e os dados podem ser usados imediatamente. Este conjunto de dados inclui a presença de dados de inteligência e vários temas de dados vetoriais culturais, raster e físicos. Originalmente feito pensando nas necessidades e preferências dos cartógrafos, este conjunto de dados é útil para qualquer pessoa interessada em geografia.
157. OpenStreet mapa
Openstreet Map é menos um site e mais uma colaboração entre usuários que agora fornece serviços de mapeamento para aplicativos, sites e vários dispositivos de hardware. Este site adquire novos dados quando os usuários inserem informações sobre pontos de referência menos conhecidos, como estações ferroviárias, estradas e trilhas. O conjunto de dados completo está disponível gratuitamente no site e pode ser baixado total ou parcialmente. Para quem optar por fazer o download parcial dos dados, também é possível fazer o download por região.
158. Cidade de Chicago
A cidade de Chicago é a casa do campeonato Bulls de Michael Jordan e de seu próprio estilo único de pizza, além de possuir um portal de dados completo próprio. As categorias do conjunto de dados abrangem uma variedade de tópicos que incluem Administração e Finanças, Ética, Saúde e Serviços Humanos, Parques e Recreação, Segurança Pública e Preservação Histórica. Em suma, o portal de dados da cidade de Chicago acolhe praticamente tudo o que possa ser de interesse para investigadores, decisores políticos e jornalistas locais.
159. CKAN
CKAN é essencialmente o lar online do projeto de dados abertos da cidade de Glasgow. Este site possui conjuntos de dados sobre vários assuntos que são úteis para empreendedores, formuladores de políticas, pesquisadores acadêmicos e desenvolvedores de aplicativos utilizarem. Dos 360 conjuntos de dados hospedados aqui, alguns estão relacionados à governança da cidade, como o conjunto de dados sobre o estoque de casas por posse, enquanto outros, como o conjunto de dados sobre ciclismo, são de particular interesse para os residentes locais. Há todo tipo de informação aqui para jornalistas que cobrem uma área mais local.
160. Governo da Índia
O Governo da Índia tem um site que cobre recursos analíticos e de dados em sua versão do Open Data Project. Atualmente, são cerca de 137.940 recursos que foram visualizados milhões de vezes no site. A grande maioria desses arquivos também está disponível para download no site. Seja procurando números sobre o orçamento do governo ou conjuntos de dados que abordem saúde e bem-estar familiar, é provável que este site tenha recursos a oferecer.
161. Banco de Portugal
Este site está repleto de estatísticas, publicações e dados atualizados recolhidos pelo governo sul-africano. Aqui os pesquisadores descobrirão informações sobre tudo, desde pesquisas sobre alimentos e bebidas até indicadores econômicos, estatísticas de emprego, números populacionais e importantes estatísticas de saúde. É possível pesquisar os números por cidade, tema e indicador dependendo da necessidade. Este site hospeda muitas informações sobre o censo e também divulga publicações estatísticas, questionários, códigos e classificações e política de preços.
162. Desenvolvimento de Políticas e Pesquisa
Este site é publicado sob a égide do Escritório de Desenvolvimento e Pesquisa de Políticas do Departamento de Habitação e Desenvolvimento dos EUA. Publica um grande número de estudos de caso, publicações semestrais e periódicos regularmente todos os anos. Ele também oferece um grande número de conjuntos de dados nos quais os jornalistas estariam interessados, sendo os aluguéis do Mercado Justo, Limites de Renda, Fatores de Inflação para Financiamento de Renovação apenas alguns dos conjuntos aos quais o público tem acesso neste site.
163. Dados Vital Net de Saúde
Na Vital Net Health Data, os pesquisadores encontrarão muitos grandes conjuntos de dados relacionados à saúde. Este site não hospeda todos esses conjuntos, mas oferece links para conjuntos que as pessoas podem visitar e encontrar informações. Esta lista selecionada está vinculada a recursos como CDC Wonder, Eurocat, Health Data All Star e também ao trabalho de organizações de caridade, como a Associação Norte-Americana de Registros Centrais de Câncer. Este é sem dúvida um dos recursos de conjunto de dados de saúde mais abrangentes que existem.
164. Ponte Analítica
Analytic Bridge é um recurso dedicado à inteligência de negócios. Aqui os pesquisadores encontrarão discussões sobre aprendizado de máquina e IA, links para webinars e conferências e até mesmo uma guia de busca de emprego. O site também hospeda o Data Science Central, que é a parte do site que foca em big data. Com a sua comunidade ativa e engajada e o seu compromisso em fornecer notícias e informações, os jornalistas interessados nas implicações dos dados para os negócios têm muito a ganhar com isso.
165. Arquivo.org
Conhecida principalmente por seus esforços para se tornar uma biblioteca pública on-line, archive.org abriga numerosos trabalhos publicados, bem como uma coleção substancial de conjuntos de dados. O site apresenta resultados do Censo da Internet de 2012, bem como arquivos do Dark Net Market de 2011 a 2015, e até mesmo um conjunto de dados de comentários públicos do Reddit. Existem despejos de dados do Music Brainz e um conjunto de dados que contém imagens de capa de áudio. Entre suas publicações e dados, archive.org tem muito material para os jornalistas consultarem.
166. Torrentes Acadêmicos
Este site se autodenomina um sistema projetado para facilitar o compartilhamento e o download de grandes conjuntos de dados. Fazendo uso da tecnologia torrent para simplificar a distribuição de dados, o Academic Torrents se orgulha de permitir que os pesquisadores baixem tudo o que precisam rapidamente. O site também hospeda artigos, cursos e acervo para visualização. Uma rápida pesquisa nos recursos disponíveis revelará que existem muitos conjuntos de dados e coleções disponíveis para download aqui.
167. Universo de dados
A melhor maneira de abordar o Dataverse é pensar nele como outro tipo de biblioteca. Aqui, os pesquisadores podem pesquisar, descobrir e citar dados com facilidade e, ao mesmo tempo, usar este site como um repositório para suas próprias informações. O assunto coberto inclui áreas como ciências sociais, ciências agrícolas, medicina, saúde e ciências da vida, bem como ciências da terra e ambientais. Grandes nomes com publicações neste site incluem Gallup e o Departamento de Comércio dos EUA, Bureau of Census, Divisão de Geografia.
168. DADOS UC
Operando em conjunto com o Laboratório de Dados de Ciências Sociais da UC Berkeley, o UC Data é o maior e mais conhecido arquivo da universidade. Este site oferece ofertas nas áreas de estatística e dados de ciências sociais. Neste site os investigadores podem aceder aos artigos, relatórios e documentos de trabalho produzidos pelos investigadores da UC Data. Os dados brutos abrangem inúmeras áreas de pesquisa que incluem cuidados de saúde, bem-estar e seguro social, demografia, votação e tecnologia da informação, entre uma série de outros tópicos.
Joe Kamp oferece um guia completo para encontrar dados e APIs de futebol e futebol para fins de análise de dados. Se os pesquisadores seguirem os links fornecidos na página, haverá dados de código aberto disponíveis no GitHub, bem como acesso a APIs gratuitas e comerciais para facilitar o acesso. Como os dados e a codificação estão disponíveis em um site bem conhecido como o GitHub, obter esse tipo de dados nunca foi tão fácil.
170. Sean Lahman
Sean Laham não é necessariamente um nome que as pessoas ouvem todos os dias, mas seu site é o lar de uma das estatísticas de rebatidas e arremessos mais abrangentes e aprofundadas da Internet. Com números que cobrem o período de 1871 a 2016, os dados remontam literalmente a séculos. Os dados são gratuitos para acesso e uso sob a licença Creative Commons Share Alike 3.0 e podem ser baixados diretamente no SQL e no Microsoft Access, para citar alguns. As estatísticas também podem ser baixadas via GitHub.
171. Folha retrô
Retro Sheet é uma das fontes mais extensas da Internet para estatísticas e dados de beisebol. O site inclui detalhes como escalações anuais e identificação de árbitros, jogadores e treinadores. Para os anos em que foi relevante, os dados do jogo das estrelas foram incluídos nos arquivos de eventos junto com um conjunto de arquivos de eventos para a pós-temporada e um pequeno arquivo de discrepâncias. O Retro Sheet ainda possui identificações de estádios de futebol para cada temporada. Que tal isso completo?
172. Desafio de dados do Hubway
Para quem não conhece o programa, Hubway é o nome do serviço de compartilhamento de bicicletas com sede na região metropolitana de Boston. É claro que o sistema não registrou e divulgou informações de identificação, mas mesmo assim o Hubway possui informações básicas sobre todas as viagens realizadas entre julho de 2011 e setembro de 2012. Isso incluía detalhes como o início e o fim da viagem, bem como a estação de coleta para citar algumas categorias.
173. Voos Abertos
Open Flights é um banco de dados que contém informações sobre mais de 10.000 terminais de balsas, aeroportos e estações de trem em todo o mundo. Os pesquisadores podem encontrar a versão .csv compatível com Excel por meio do GitHub e também podem baixar os dados diretamente no site. Usando o mapa da página inicial, é possível ver quais locais específicos estão na lista e o site chega a ter informações de rotas disponíveis também. Os proprietários do site podem ser contatados para obter informações ainda mais atualizadas.
174. MLVIS
MLVIS é um repositório de dados que combina análise visual com mineração de dados em tempo real. Isso torna possível explorar uma compreensão mais intuitiva dos dados, mesmo ao trabalhar com grandes conjuntos de dados. Dados de referência e aprendizado de máquina não relacional, juntamente com diferentes tipos de dados, como atribuídos e heterogêneos, estão entre os muitos recursos e opções disponíveis neste site. Para maior comodidade dos usuários, essas informações também podem ser baixadas em um único formato consistente.
Open Data Inception é um site que oferece links para mais de 2.600 portais de dados. Ao utilizar a barra de pesquisa na parte superior, os pesquisadores podem pesquisar portais e conjuntos de dados por categoria e por tema. Além disso, também é possível utilizar o site como meio de encontrar a versão mais atualizada do conjunto de dados pesquisado. Aproveite a capacidade de visualizar portais de dados em formato de lista ou em formato visual interativo e comece a encontrar os dados necessários.
176. OpenDataSoft
Disponível em francês, inglês e alemão, OpenDataSoft é uma fonte que oferece acesso a 480 milhões de registros, 4 milhões de células API e 9.284 conjuntos de dados. Usando a barra de pesquisa no meio da página inicial, os pesquisadores podem inserir uma palavra-chave ou categoria e encontrar o conjunto de dados mais apropriado a partir daí. Para os jornalistas, esta é uma forma mais rápida de encontrar os conjuntos de dados mais relevantes necessários para concluir a investigação em questão. Visite o site para saber mais.
177. Mestre da nação
O NationMaster é uma fonte de dados totalmente compilados de mais de 300 países, organizados em mais de 5.000 categorias. Os dados abrangem números que incluem números sobre a percentagem de mortes registadas, estatísticas da 2ª Guerra Mundial e até informações sobre guerra e testes nucleares. Os pesquisadores também encontrarão tabelas, gráficos e gráficos de pizza que permitirão uma visualização posterior dos dados. Simplificando, há tantos assuntos abordados que sempre há algo novo para encontrar nos dados.
178. Seguidor
O Twitter é há muito tempo um site de mídia social popular para as últimas notícias e para encontrar histórias de tendências. Followerwonk permite que os usuários levem o uso do Twitter para o próximo nível. Isso inclui encontrar usuários do Twitter com quem se conectar, estudar os seguidores atuais e planejar a atividade no Twitter para obter resultados máximos. Hoje em dia, há muitos repórteres e jornalistas no Twitter que usam o site para fazer networking e divulgar histórias. Followerwonk torna os usuários do Twitter mais produtivos no site.
179. Infochimpanzés
Infochimps é um site que oferece serviços baseados em nuvem que podem ser reduzidos para aproveitar ao máximo o big data. É útil quando se trata de implantar e integrar tecnologia e aplicativos de big data. Quando os pesquisadores pesquisam grandes quantidades de dados ou avaliam tendências em big data, este é um recurso inestimável. Existem também vários white papers e casos disponíveis para os pesquisadores visualizarem no site.
180. Estatísticas arquivadas do governo nacional
Fundado em 2006, o Archive-It é um serviço prestado pelo Internet Archive. Este serviço ajuda organizações e empresas a criar coleções digitais e, como resultado, tem tido oportunidades de trabalhar com organizações sem fins lucrativos, faculdades, universidades e governos. Os pesquisadores podem pesquisar alguns dos diferentes arquivos no site, como sites da corrida para candidatos ao Congresso de 2014, os Arquivos do Estado do Alabama e o Arquivo da Web PLN de Informações do Governo Canadense. Este site é um tesouro de informações para jornalistas empreendedores.
181. Comuns Cívicos
Civic Commons tem uma página que lista as diversas iniciativas governamentais de dados abertos. Esta lista pesquisável de recursos está organizada por país, cidade, região e ainda faz menção aos recursos disponibilizados por organizações intergovernamentais. Para os jornalistas, este site representa uma forma mais rápida de descobrir quais governos estão participando do Projeto Dados Abertos. Este site também concede acesso a dados localizados que não apareceriam necessariamente em uma simples pesquisa no Google.
182. Governos Mundiais Guardiões
The Guardian é um nome famoso no mundo do jornalismo por sua reputação de notícias de última hora. O que menos pessoas percebem é que o site tem uma seção que oferece dados sobre e sobre governos de todo o mundo. Existem artigos sobre o impacto do número de sem-abrigo, debates sobre segurança cibernética e até discussões ponderadas sobre o papel que os dados e as estatísticas têm de desempenhar no actual clima político e social. A seção do Governo Mundial do Guardian é capaz de iniciar discussões e encontrar ângulos para histórias.
183. Dados governamentais abertos (Hub)
Este site pertence a um grupo da Open Knowledge Foundation com o objetivo de incentivar e apoiar o desenvolvimento contínuo de dados governamentais abertos. Aqui, os usuários descobrirão links para uma das mais extensas listas de catálogos de dados abertos disponíveis. Entre as metas adicionais mencionadas no site, o grupo também busca encontrar informações sobre políticas, melhores práticas e diretrizes. Proporciona aos jornalistas amplo acesso a mais e melhores informações.
Este site é a página inicial on-line do projeto de dados abertos oferecido pelo Governo da França. É possível aprofundar os dados pesquisando em categorias como emprego, agricultura, educação, viagens e turismo. São dados que permitem construir e desenvolver uma compreensão mais matizada do que os dados realmente dizem, ao mesmo tempo que deixam espaço para comparações com base nas informações históricas. Basicamente, os jornalistas têm todos os motivos para estar entusiasmados em analisar esses dados.
185. Universidade de Notre Dame
Este site armazena os dados de pesquisa disponíveis através do uso do SourceForge.net pela Universidade de Notre Dame. Os dados são oferecidos por meio de bancos de dados relacionais. Os despejos mensais de dados também possibilitam uma melhor compreensão do software de código aberto e de suas aplicações. Para aceder a esta informação, os pedidos de acesso deverão ser efetuados por escrito através de email. O problema, contudo, é que os investigadores académicos e académicos são os únicos elegíveis para acesso aos dados.
186. Relatórios de OVNIs
O Centro Nacional de Relatórios de OVNIs possui um banco de dados online detalhando as experiências das pessoas com objetos voadores não identificados. Os pesquisadores podem agilizar sua pesquisa no banco de dados usando qualquer uma das quatro categorias de data, formato do OVNI, data de publicação e até mesmo por estado. Os OVNIs são únicos porque nunca deixam de capturar a imaginação do público. Se houve algum encontro recente do terceiro tipo acontecendo nas proximidades, este é o lugar para descobrir o que as pessoas têm dito.
187. WikiLeaks
Notório e infame na mídia devido às controvérsias e ao que os vazamentos revelaram sobre o funcionamento interno do governo e de outras figuras famosas e poderosas da sociedade, o WikiLeaks tem uma reputação que o precede. Embora os despejos de dados raramente sejam descartados silenciosamente, ninguém questiona a precisão das informações. Para jornalistas em busca de histórias que atraiam interesses instantaneamente, o WikiLeaks é uma fonte comprovada. No mínimo, será uma leitura interessante.
188. O Washington Post
O jornal já é conhecido como uma excelente fonte de notícias de última hora e artigos de opinião, mas poucas pessoas sabem que o Washington Post concede acesso aos dados brutos frequentemente mencionados em seus artigos. Na página de dados, os pesquisadores podem encontrar dados em categorias como educação, censo, saúde e segurança, transporte e desenvolvimento, bancos de dados históricos da Copa do Mundo e até números relativos ao governo e à política. Simplificando, ter acesso a estes números ajuda as pessoas a desenvolver uma compreensão mais concreta dos assuntos noticiosos.
189. Dados climáticos
Climate Data é um conjunto de dados que fornece informações abrangentes sobre a temperatura global. No formato atual, os usuários podem ver todas as informações climáticas importantes por meio das grades, ao mesmo tempo que podem ver quais são as médias. Para quem busca os dados complementares, é possível ter acesso às mesmas informações também para terra e oceano. Essas informações podem ser baixadas, mas por uma questão de comodidade, também podem ser visualizadas diretamente no site.
190. Estrutura Proteica
Protein Structure é uma fonte que busca examinar como redes de computadores podem ser usadas em conjunto com a biologia. A página hospeda um repositório com dados que podem ser acessados através dos links fornecidos. De particular interesse para os membros da comunidade de pesquisa é como o site incorpora diversas ideias, como análise de modelos e biologia executável, na busca desse objetivo. Para os jornalistas, vale a pena visitar este site para observar o progresso e examinar os dados.
191. Analise dados de pesquisas gratuitamente
Com a ajuda deste site, os usuários podem fazer um curso de análise de dados de pesquisas sem ter que pagar pelo privilégio. Analise dados de pesquisa gratuitamente com seu índice detalhado, inclui seções com títulos esportivos como Mapas e Arte da Pesquisa - Manutenção Ponderada, Equilibrando a Confidencialidade do Respondente com Precisão de Estimativa de Variância, Modelos de Equações Estruturais (SEM) e Dados de Pesquisa Complexos. O site oferece uma ótima atualização para aqueles que prevêem lidar com mais dados estatísticos no futuro.
192. UCLA
No site wiki da UCLA, os pesquisadores encontrarão vários conjuntos de dados disponíveis para fins de demonstração. Há muitos dados simulados e observados para você escolher. Usando estes recursos, é possível que as pessoas utilizem este recurso para descobrir dados climáticos, dados populacionais, dados biomédicos, dados de neuroimagem, dados do censo dos EUA, dados eleitorais e dados económicos, entre inúmeras outras categorias. Em última análise, esses conjuntos de dados são um recurso do qual muitas pessoas podem se beneficiar.
Na página do site, a Universidade de Toronto oferece aos pesquisadores acesso ao que chama de conjuntos de dados Delve. Essas coletas de dados faziam parte de um produto maior desenhado com o propósito de fazer comparações entre os métodos de aprendizagem. Em última análise, esta informação existe para o desenvolvimento e avaliação das diferentes abordagens à aprendizagem. Resumindo, esta é uma fonte sólida para pesquisadores que desejam compreender melhor como analisar e manusear conjuntos de dados.
194. Serviço de Conservação de Recursos Naturais
O Serviço de Conservação de Recursos Naturais possui um site que se concentra na promoção da conservação, ao mesmo tempo que oferece informações sobre os diferentes musgos, antóceros, plantas vasculares, líquenes e hepáticas presentes nos Estados Unidos. Este site hospeda um banco de dados completo de plantas e imagens de plantas que podem ser encontradas no site para conter toneladas de informações. Os pesquisadores podem baixar o banco de dados e encontrar toneladas de informações sobre tópicos como culturas alternativas. Essencialmente, este site tem tudo o que as pessoas precisam saber sobre plantas.
195. Serviço de Pesquisa Agrícola
Como pode ser deduzido do nome da agência, este serviço cuida das necessidades de pesquisa do Departamento de Agricultura dos EUA. Sempre que um problema agrícola é descoberto, esta é a parte do governo que provavelmente ajudou a encontrar uma solução. O site hospeda vários conjuntos de dados que podem ser acessados e baixados diretamente. Os jornalistas também podem utilizar este site para encontrar as últimas notícias relacionadas às questões que afetam a agricultura.
196. Biblioteca de imagens celulares
Este site oferece uma biblioteca pública que oferece recursos, informações e acesso a imagens e animações que retratam células e processos celulares. A célula foi projetada tendo em mente o duplo processo de pesquisa e educação; as informações aqui contidas são quase sempre relevantes durante discussões sobre saúde pública e doenças. Os materiais vêm de uma combinação de fontes, incluindo publicações históricas e modernas. Para uma explicação completa que simplifique processos biológicos complicados, os jornalistas não podem errar com a Cell Image Library.
197. Genômica Completa
Este é o site de uma empresa que se considera uma parte consolidada do espaço biotecnológico na área de sequenciamento do genoma humano. Curiosamente, a Complete Genomics disponibilizou ao público algumas de suas sequências completas de genoma. Em última análise, isto oferece todos os tipos de informações úteis sobre o DNA e o genoma humano sequenciado. A única condição neste material é que os pesquisadores que estão usando essas informações tenham o cuidado de fornecer referências adequadas à Complete Genomics.
198. Matriz Expressa
Array Express é um repositório que armazena informações dos resultados de experimentos genômicos que exigiram grandes quantidades de sequenciamento ou processamento. Neste site, os usuários encontrarão os resultados de mais de 70.000 experimentos, além de mais de 2 milhões de ensaios em vários terabytes de armazenamento de dados. Melhor ainda, esta informação é gratuita para reutilização para fins de pesquisa. Este é um excelente recurso para obter todas as informações mais recentes sobre genômica e o progresso feito na área.
199. Codificar
A Enciclopédia de Elementos de DNA, ou Consórcio ENCODE, é o resultado de grupos de pesquisa de todo o mundo que trabalham em colaboração entre si. Em última análise, o objetivo é compilar uma lista de todas as partes funcionais do genoma que inclua o exame minucioso dos níveis de RNA, das proteínas, dos elementos que regulam as células e da atividade dos genes. Existem dados que podem ser pesquisados, bem como uma enciclopédia que oferece mais informações.
200. Conjunto de Genomas
Ensemble Genomes é um site criado em 2000 que trata dos genomas de vertebrados. Ao longo dos anos, este recurso adicionou informações complementares sobre metazoários invertebrados, plantas, bactérias e fungos. Os dados sobre todos esses assuntos podem ser encontrados e acessados clicando nos links disponíveis no site. Este site possui tutoriais, conjuntos de dados sobre todos os tópicos abordados e uma coleção de documentos para navegar. Todos esses fatores fazem do Ensemble Genomes uma fonte de dados fantástica para jornalistas.
201. Consórcio de Ontologia Genética
Gene Ontology é um site que existe com o propósito expresso de encontrar uma maneira de representar a compreensão atual de como os genes operam por computador. Possui inúmeras publicações, bem como documentação adicional que as pessoas podem ler. Existem anotações hospedadas diretamente no site. A boa notícia para os pesquisadores que desejam analisar mais de perto os números e os dados brutos é que existem arquivos disponíveis para download diretamente no site.
202. Biblioteca de assinaturas celulares integradas baseadas em rede
O Centro LINCS da Harvard Medical School existe com o propósito de ajudar a comunidade de pesquisa e o público em geral a aprender mais sobre como as células humanas reagem quando são perturbadas por drogas. Usando o banco de dados HMS LINCS e a ferramenta exploradora de projetos, os pesquisadores podem encontrar publicações e resumos de projetos, bem como recursos gerais. Os jornalistas também podem usar este site para obter as últimas notícias e informações resultantes desta pesquisa.
203. Projeto de Diversidade do Genoma Humano
O Projeto de Diversidade do Genoma Humano tem feito muitos progressos através dos esforços do Centro do Genoma Humano de Stanford. O site possui amostras que possuem milhares de amostras e marcadores. Acontece que eles podem ser baixados, observados e analisados minuciosamente simplesmente seguindo os links fornecidos na página. Este é um excelente recurso para jornalistas que desejam compreender as informações provenientes da comunidade de pesquisa.
204. Visualizador de dados JCB
O JCB DataViewer permite que os interessados no que o Journal of Cell Biology tem a dizer vejam os dados de imagem associados aos artigos ali publicados. O site possui uma galeria completa que as pessoas podem percorrer para ver os materiais. Além disso, os visualizadores também têm a opção de fazer análises mais aprofundadas dos dados enquanto navegam no site. Simplificando, este site é perfeito para compreender as referências e figuras presentes nos artigos da revista.
205. Portal de dados comuns de dados genômicos
O Portal de Dados GDC é uma plataforma projetada para ajudar pesquisadores e profissionais da área de bioinformação a realizar pesquisas sobre câncer com mais eficiência. Existe um arquivo, uma API, bem como documentos disponíveis para leitura e assim por diante. Acessar este site significa poder ver as mesmas informações que os pesquisadores do câncer estão usando para conduzir suas próprias pesquisas. Aqui, os jornalistas poderão encontrar todos os dados que procuram e mais alguns.
206. Opensp
O Opensp é um projeto comunitário desenvolvido com o objetivo de compartilhar genótipos. Pessoas que foram digitadas usando FamilyTreeDNA, 23andMe ou deCODEme podem enviar essas informações para o site. O objetivo de pedir às pessoas que façam isso é para que o site possa se concentrar em ver se podem ser encontradas conexões entre genótipos e SNPs, ou polimorfismos de nucleotídeo único. O que é de interesse único para os jornalistas é que há dados disponíveis para as pessoas baixarem e se divertirem olhando.
207. Guia de caminho
Pathguide é um site dedicado a fornecer informações sobre vias metabólicas e de sinalização, bem como as interações entre proteínas em nível molecular. Esta página hospeda uma lista de aproximadamente 697 recursos relacionados ao assunto principal. Os bancos de dados vinculados a este site são geralmente de acesso gratuito. A maioria das referências fornecidas nesta lista de recursos concentra-se principalmente na interação proteína-proteína. Este site é um recurso inestimável para entusiastas da biologia.
208. RCSB PBB
Este é um site dedicado a informar os acadêmicos e o público em geral sobre tudo relacionado a ácidos nucléicos e proteínas. O RCSB Protein Data Bank oferece acesso a várias ferramentas projetadas para tornar este aspecto da biologia mais compreensível, incluindo ferramentas de visualização, visualização de estrutura 3D e um arquivo totalmente pesquisável que pode ser categorizado por categoria de organismo. Além disso, este site oferece notícias atualizadas sobre todos os desenvolvimentos mais recentes neste campo.
209. Consórcio de Genômica Psiquiátrica
O Psychiatric Genomics Consortium é o resultado da colaboração entre investigadores e cientistas de todo o mundo que trabalham em pesquisas relativas ao componente genético dos transtornos psiquiátricos. No final das contas, este projeto foi capaz de produzir 17 artigos principais e 31 artigos de desenvolvimento adicionais, oferecendo análise e método secundários com um único artigo de referência que resultou de tudo isso. O Consórcio oferece ferramentas, downloads e acesso às descobertas através do portal de acesso a dados mediante solicitação.
210. Pub Química
PubChem é um nome respeitado no campo da pesquisa médica e biológica há muito tempo. Oferecendo a capacidade de pesquisar estruturas, bem como bancos de dados de compostos, bioensaios e substâncias, os pesquisadores não podem errar com este site. Além disso, existem milhões de entradas presentes em cada uma dessas bases de dados. Essas informações podem ser visualizadas por meio de ferramentas como as ferramentas conformador 3D e as ferramentas BioAssay. Os dados também estão disponíveis para download.
211. CÓSMICO
Como o nome sugere, o Catálogo de Mutações Somáticas no Câncer, ou COSMIC, é dedicado à crônica e à exploração dos efeitos das mutações somáticas no câncer. O site possibilita pesquisar o COSMIC categorizado por tipo de câncer, gene e mutação. Existem ferramentas no COSMIC, como o navegador do genoma e o navegador do câncer. Além disso, também há dados sobre curadoria de genes, resistência a medicamentos, triagens de genoma, assinaturas mutacionais e curadoria de fusão de genes disponíveis no site para download.
212. Genômica da sensibilidade a medicamentos no câncer
A Genômica da Sensibilidade a Medicamentos no Câncer se dedica a encontrar biomarcadores que possam ajudar os médicos a identificar o tipo de medicamento anticâncer ao qual os pacientes têm maior probabilidade de responder. Os jornalistas podem usar as abas de notícias para se manterem atualizados sobre a presença de novos dados ou alterações no site. Além disso, há também uma compilação de dados sobre linhagens celulares, um banco de dados que narra as características do câncer e até uma lista de compostos disponíveis para visualização no site.
213. Instituto Stowers de Pesquisa Médica
O site do Stowers Institute for Medical Research oferece ao público pesquisador acesso gratuito aos dados que seus cientistas, cientistas pesquisadores e cientistas genômicos usaram em suas publicações. Para o público em geral, o instituto se esforça para ressaltar que o acesso ao Stowers Original Data Repository normalmente é gratuito. Dito isto, alguns dos maiores arquivos do banco de dados podem não ser acessíveis diretamente pela Internet e podem exigir arranjos adicionais.
214. Banco de dados SSBD
O banco de dados de sistemas Science of Biological Dynamics, normalmente chamado de banco de dados SSBD, fornece um conjunto de ferramentas e recursos a serem usados com a finalidade de examinar imagens microscópicas e avaliar dados biológicos quantitativos. As imagens encontradas neste site vieram de diversas fontes e incluem objetos como células, moléculas únicas e núcleos de expressão gênica. Com os dados deste site adquiridos a partir de simulações e experimentos computacionais, os jornalistas podem ter certeza de que as informações aqui contidas são constantemente refinadas e atualizadas.
215. Compartilhando Genomas Pessoais
O Personal Genome Project é um site focado na criação de dados de saúde, genoma e características que estão abertos e disponíveis ao público. Dando continuidade ao projeto em grande parte com a assistência de indivíduos que se voluntariaram para tornar públicas suas informações genômicas, este site oferece gratuitamente ao público os dados que encontrou e adquiriu com sucesso. Deixando a ciência de lado, este projeto oferece aos jornalistas uma visão interessante dos efeitos da criação de um registro público de informações pessoais do genoma.
O USCS Genome Browser permite que indivíduos visualizem conjuntos de genomas. Além da visualização online, o site também fornece links que podem ser usados para baixar as sequências e anotações dessas mesmas montagens de genoma. Esses links são divididos nas categorias de humanos, mamíferos, outros vertebrados, deuterostômios, insetos, nematóides, outros genomas e outros downloads. As ferramentas e diretórios deste site também são gratuitos para uso pessoal e não comercial. Os jornalistas podem beneficiar do rigor e da acessibilidade desta informação.
217. UniProt
O Universal Protein Resource, conhecido pelo nome UniProt, é o local para obter informações sobre sequenciamento e anotação de proteínas. Com base nas informações fornecidas por três bancos de dados nos Clusters de Referência UniProt, na Base de Conhecimento UniProt e no Arquivo UniProt, este site está equipado com pesquisas de peptídeos e clusters, entre outros recursos. Os jornalistas podem usar este site para verificar, descobrir e aprender mais sobre novas descobertas na área de sequenciamento e anotação de proteínas.
218. Dados do Índice Climático Atuário
O Índice Climático dos Atuários, também chamado de ACI, fornece ao público em geral e aos tomadores de decisão informações sobre as tendências climáticas e o efeito das mudanças climáticas no Canadá e nos EUA. Os pesquisadores podem examinar as informações fornecidas por esta ferramenta educacional para encontrar e descobrir grandes mudanças no mar e no clima. É possível restringir a busca por regiões e componentes. Este site tem décadas de dados à sua disposição e atualiza rotineiramente suas informações trimestralmente.
219. Centro Meteorológico de Aviação
O Aviation Weather Center fornece informações precisas, oportunas e atualizadas sobre o clima nas quais o sistema do espaço aéreo pode confiar. Neste site os usuários podem visualizar vários gráficos, previsões e observações meteorológicas enquadradas de forma que os aviadores possam apreciar. É possível visualizar as informações fornecidas pelas fontes de dados do site em tempo real através de saída .csv ou XML. Os pesquisadores podem manipular e observar os números brutos mais de perto por meio desta opção de download.
220. Unidade de Pesquisa Climática
O website da Unidade de Investigação Climática existe com o propósito expresso de realizar pesquisas sobre os efeitos das alterações climáticas no passado, estudar as causas e encontrar soluções para as questões das alterações climáticas no presente. Aqui, as pessoas podem ler os resultados da pesquisa, obter uma visão geral do assunto por meio das fichas informativas, ler publicações e até acessar os dados brutos. Jornalistas em busca de conjuntos de dados meteorológicos brutos estão com sorte com este recurso.
221. Avaliação e conjunto de dados climáticos europeus
No website do European Climate Assessment & Dataset, o público pode descobrir informações sobre mudanças extremas no clima ou no tempo. Os pesquisadores têm a opção de usar a ferramenta de pesquisa do projeto, chamada KNMI Climate Explorer, para verificar dados, examinar previsões sazonais e até observar mais de perto os efeitos do El Niño, entre outras aplicações. Uma vez que este conjunto de dados é atualizado diariamente, os jornalistas que utilizam esta fonte serão os primeiros a saber sobre quaisquer sinais de alterações climáticas extremas.
222. Serviços globais de navegação de imagens
O Global Imagery Browse Services, abreviadamente GIBS, é uma parte essencial da EOSDIS em seu papel como fornecedor de serviços de imagens que são responsivos e baseados em padrões comunitários. Dito de outra forma, o GIBS permite que pessoas comuns interajam com imagens de satélite tiradas de praticamente qualquer lugar do planeta em alta definição. Como o EOSDIS GIBS é disponibilizado através dos dados de ciências da terra da NASA, é mais fácil do que nunca para jornalistas e investigadores aprenderem mais sobre o mundo em tempo real.
223. Clima e Ecossistema de Bering
Operando sob a Administração Nacional Oceânica e Atmosférica do Governo dos Estados Unidos, este website informa aos jornalistas e investigadores tudo o que poderiam querer saber sobre como o clima e o ecossistema do Mar de Bering estão a reagir às mudanças que ocorreram no Árctico. Aqui, é possível ler ensaios, revisar projeções e usar a ferramenta de dados on-line para ver o desempenho de vários índices climáticos, dados biológicos, atmosféricos, oceânicos e da vida selvagem no Mar de Bering.
224. NCIE
O NCEI, ou Centros Nacionais de Informação Ambiental, é o resultado final da fusão dos três centros de dados da Administração Oceânica e Atmosférica Nacional. Esta página hospeda uma série de links divididos em 22 categorias que vincularão os usuários a diferentes recursos, páginas de interesse e conjuntos de dados climáticos e meteorológicos. Jornalistas em busca de informações sobre clima, tempestades, precipitação e uma série de outras preocupações climáticas provavelmente encontrarão aqui o que procuram.
225. Laboratório de Pesquisa do Sistema Terrestre
A Divisão de Monitorização Global da Administração Oceânica e Atmosférica Nacional fornece informações sobre as tendências de longo prazo das forças das alterações climáticas na Terra através da monitorização das principais métricas atmosféricas. Entre estes estariam o monóxido de carbono, o metano, o óxido nitroso e o dióxido de carbono, a título de exemplo. Estas métricas são então utilizadas para medir coisas como a destruição da camada de ozono a longo prazo, as fontes e os níveis de dióxido de carbono, bem como os sumidouros. Este é um recurso sobre alterações climáticas que os jornalistas podem utilizar.
226. WorldClim – Dados climáticos globais
Sempre quis uma maneira melhor de visualizar dados climáticos? WorldClim é um fornecedor de software de dados gratuitos que podem ser aplicados à modelagem espacial, bem como à criação de mapas. A versão atual deste software gratuito só pode ser aplicada ao clima atual, enquanto a versão antiga permite o acesso a dados climáticos do passado e do presente e também permite aos utilizadores ver o estado das previsões climáticas futuras. Os jornalistas podem simplesmente seguir o link e baixar o software.
227. Laboratório de descoberta de conhecimento
O Knowledge Discovery Laboratory é um site dedicado ao desenvolvimento de tecnologias inovadoras, aos fundamentos do aprendizado de máquina e à aplicação desse conhecimento em áreas práticas como ciência de redes, detecção de fraudes e análise de dados científicos. O site hospeda um conjunto de dados bastante considerável no DBLP com 1,2 milhão de objetos e 2,48 milhões de links incluídos no conjunto. Para pesquisadores interessados nos objetivos do Laboratório de Descoberta de Conhecimento, este conjunto de dados é um excelente recurso.
228. Desafio de implementação DIMACS
O site do 9º Desafio de Implementação tem como objetivo ajudar pesquisadores a aprender como resolver problemas de caminho mais curto. Para os criadores, o site foi construído com dois objetivos em mente. Primeiro, para encontrar as melhores soluções reproduzíveis. E segundo, facilitar a colaboração dos pesquisadores e a descoberta de soluções mais eficazes. Pesquisadores interessados em ver quanto progresso foi feito nisso podem revisar os artigos e os conjuntos de dados no site.
229. Repositório de Rede
O Network Repository é um site onde são armazenados dados científicos com a adição de ferramentas visuais interativas que os usuários podem acessar e analisar. Este site tem a dupla distinção de ser o primeiro repositório desse tipo e também o maior da web. Utilizar dados gráficos e imagens intuitivas e visualmente envolventes, fazer comparações e encontrar novas maneiras de contextualizar os dados é muito mais fácil. Os jornalistas podem usar esta fonte para encontrar histórias nos dados científicos.
Pajek Datasets é uma página que fornece um conjunto de dados que aborda as interações entre proteínas encontradas em leveduras em crescimento. Depois de oferecer uma breve explicação básica sobre o impacto de encontrar novos métodos de detecção de interações, juntamente com as razões pelas quais ser capaz de discernir a importância de várias interações entre proteínas é essencial, o site vincula os espectadores diretamente a um conjunto de dados que está disponível para download. Para saber mais, os pesquisadores podem clicar no link abaixo para ler o artigo publicado sobre o assunto.
231. Dados da rede Mejn
Este site busca compartilhar links para conjuntos de dados de rede que o proprietário da web usou e compilou. Os temas dos conjuntos de dados variam desde futebol americano universitário, blogs políticos e livros sobre política americana, até redes sociais, Os Miseráveis e colaborações na teoria de alta energia. Indivíduos interessados em explorá-los terão muitos temas interessantes de conjuntos de dados para escolher. Além disso, os dados são de uso gratuito, desde que haja referências.
232. O Stanford GraphBase
Stanford GraphBase é o nome dado a vários conjuntos de dados e programas por Donald Knuth, de Stanford. Quando usados em combinação entre si, esses programas e conjuntos de dados são capazes de manipular e gerar gráficos e redes. Neste site os materiais necessários estão disponíveis para download através dos links. Nestes arquivos, os pesquisadores encontrarão dados de resultados de futebol, dados de dicionário, dados relativos à reconstrução da Mona Lisa e muitos outros.
233. Coleção de matrizes SuiteSparse
Anteriormente conhecida como Coleção de Matrizes Esparsas da Universidade da Flórida, a Coleção de Matrizes SuiteSparse é uma coleção de matrizes que têm implicações na vida real. De acordo com o site, esta coleção específica é usada com mais frequência para álgebra linear numérica no desenvolvimento e refinamento de algoritmos de matrizes esparsas. Os usuários tendem a gostar da coleção por sua utilidade na execução e teste de resultados de experimentos. Os conjuntos de dados e benchmarks de matriz estão disponíveis para download diretamente no site.
234. Conjuntos de dados gráficos
Este é um conjunto de conjuntos de dados que os criadores desta página da web acreditam ser relacionais ou capazes de traduzir bem para representação gráfica. Graph Datasets oferece conjuntos de dados como dados do Predictive Toxicology Challenge, dados IMDb, dados de mutagênese, dados MovieLens, filtragem colaborativa e dados de proteínas para pesquisadores que desejam aprender como trabalhar com números brutos. Os arquivos são disponibilizados nesta página e estão disponíveis principalmente para download em formato XML.
Big Data News é um site focado em big data e nos fundamentos da ciência de dados. Este site contém as últimas notícias e inclui discussões sobre aprendizagem profunda e inteligência artificial. Além disso, o Big Data News também abriga um enorme conjunto de dados que contém um total de aproximadamente 3,5 bilhões de páginas da web. Todos eles são separados por níveis chamados de gráfico de nível de página, gráfico de nível de subdomínio, gráfico de subdomínio de primeiro nível e gráfico de domínio de nível de pagamento, respectivamente.
236. Centro de Redes Complexas e Pesquisa de Sistemas
CNetS, ou Centro de Pesquisa de Redes Complexas e Sistemas, operando sob a égide do Indiana University Network Science Institute e da Escola de Informática e Computação. O site pretende ser um recurso nas áreas de ciência de dados, ciências sociais computacionais e redes e sistemas complexos com informações sobre mineração e padrões de tráfego online. Além disso, o CNetS também hospeda um conjunto de dados contendo aproximadamente 53,5 bilhões de solicitações de rede feitas por usuários da Universidade de Indiana.
237. Explorador OONI
OONI Explorer, parte do Open Observatory of Network Interference, é um projeto dedicado a fornecer software gratuito e de código aberto. É possível que os usuários usem o software para tentar bloquear sites e aplicativos de mensagens, entre outros aplicativos. De particular interesse para as pessoas interessadas nesta tecnologia é a disponibilidade de acesso gratuito aos dados brutos que a OONI coletou. Basta inserir as informações no OONI Explorer e interagir com os dados de lá.
238. Desafios no aprendizado de máquina
Challenges in Machine Learning dedica-se à pesquisa e desenvolvimento de aprendizado de máquina. Neste site os leitores encontrarão links para softwares, livros, desafios de aprendizado de máquina, bem como notificações de próximos workshops. O site ainda fornece links para desafios que permitem envios pós-data. Para jornalistas interessados em ver se o aprendizado de máquina pode realizar tarefas como previsão financeira ou classificação de páginas da web, este é um site que vale a pena visitar.
239. DadosX
Atualmente trabalhando sob a égide do CrowdANALYTIX, o DataX é a parte mecânica de uma iniciativa voltada para a comunidade que aproveita o poder do coletivo para criar aplicativos personalizados de Inteligência Artificial, aprendizado de máquina e Programação Neurolinguística. A função do DataX no processo é a manutenção e implantação que, por sua vez, servem para tornar essas soluções escalonáveis. Para jornalistas que têm toneladas de texto, vídeo e dados para classificar, os bots disponíveis através do CrowdANALYTIX e DataX podem reduzir pela metade o tempo de pesquisa.
240. Dados orientados
O Driven Data combina crowdsourcing com ciência de dados de uma forma que quase nenhum outro site faz. Enfatizando seu papel na prestação de assistência a organizações que enfrentam diferentes desafios sociais, este site oferece ajuda colocando sua substancial comunidade de ciência de dados para trabalhar na criação de modelos estatísticos que resolvem questões preditivas. O Driven Data parece funcionar principalmente com organizações sem fins lucrativos, mas é potencialmente útil para qualquer pessoa que tenha dados brutos que precisam de refinamento. Os jornalistas podem beneficiar se mantiverem esta fonte em mente.
241. Abra Big Data
API Dandelion é um aplicativo que lida com análise semântica de texto para big data. O que isto significa para as pessoas que possuem dados que requerem processamento é que este programa pegará texto desorganizado e encontrará uma maneira de contextualizá-lo. Jornalistas que analisam muitos documentos podem definitivamente se beneficiar dessa capacidade. A API Dandelion também possui Open Big Data nas categorias Milão, Trento e Europa. Embora esta API seja paga, existe uma quantidade diária de texto que pode ser analisada gratuitamente.
242. Modelos terrestres
Earth Models se concentra no compartilhamento e armazenamento de software e conjuntos de dados relacionados à Terra. As ferramentas de modelagem mencionadas no site incluem software de simulação e processamento, bem como dados virtuais que se baseiam fortemente em áreas específicas de estudo, como tectônica e sismologia. Jornalistas e pesquisadores que desejam aprimorar seus conhecimentos sobre o assunto podem utilizar as publicações e artigos deste site para fazê-lo antes de mergulhar nas ferramentas de modelagem e visualização.
243. Centro de Dados e Aplicações Socioeconômicas (SEDAC)
O Centro de Dados e Aplicações Socioeconômicas, ou SEDAC, é um dos data centers associados ao sistema EOSDIS da NASA. Neste site, os leitores encontrarão conjuntos de dados que oferecem números sobre mudanças climáticas ou informações demográficas em grade. Os conjuntos de dados também podem ser pesquisados por temas como Governança, Agricultura, Uso da Terra, Saúde, Conservação e Clima, Água, Sensoriamento Remoto e Pobreza. São mapas, galerias, guias que dão mais contexto aos dados e recursos e ferramentas adicionais que os pesquisadores também podem acessar no site.
244. Portal AODN
O Portal AODN, um site mantido pela Australian Ocean Data Network, é um site que oferece acesso à ciência climática e aos dados marinhos australianos. Os pesquisadores que acessarem essas informações também terão acesso aos dados e metadados do IMOS, que é uma estrutura de pesquisa de múltiplas instituições, incluindo o apoio do governo australiano. Os investigadores que optam por aproveitar o Portal AODN podem esperar receber uma excelente entrega de dados oceânicos numa interface intuitiva.
245. Planeta SO
Planet OS oferece uma estrutura de big data com ênfase em energia renovável. Essa escolha de nicho aliada à proficiência do site o tornou popular entre as empresas de energia em busca de novas formas de visualizar e contextualizar seus dados. Além disso, o site também possui o chamado DataHub, onde hospeda uma coleção substancial de mais de 2.000 conjuntos de dados. Esses conjuntos de dados incluem dados abertos através da NASA e do Copernicus e os dados são frequentemente atualizados regularmente.
O Smithsonian é há muito tempo um nome acadêmico respeitado e apreciado em todo o mundo por seu compromisso com a pesquisa e a história. Em alguns aspectos, é natural que o Smithsonian tenha um site que ofereça algumas das melhores informações on-line sobre pesquisas sobre vulcões. O site publica relatórios, links de pesquisa e bancos de dados que incluem pesquisas estreitas de vulcões, erupções, emissões e deformações para acompanhar a lista e planilha de vulcões do Holoceno. Os jornalistas não precisarão de outra fonte sobre a atividade vulcânica.
247. Catálogo Terremoto
Atualizado e mantido pelo Programa de Riscos de Terremotos do governo dos EUA, o Catálogo de Terremotos permite aos pesquisadores ver quando e onde ocorreu um terremoto pela última vez. Embora os resultados da pesquisa sejam limitados a 20.000, a pesquisa no catálogo é capaz de filtrar os resultados por magnitude, data e hora e até mesmo por região geográfica. Este nível de flexibilidade torna este recurso particularmente útil para jornalistas que cobrem um desastre natural ou um terremoto local e procuram algumas informações básicas.
248. Associação Econômica Americana
A American Economic Association fornece aos pesquisadores dados macroeconômicos dos EUA e de outros países ao redor do mundo. Este site não parece produzir dados econômicos, mas sim uma pequena lista dos mais confiáveis. Contudo, à luz dos muitos sites que oferecem informação económica na Internet, este é um recurso que os jornalistas podem esperar que tenha credibilidade. Basta acessar o site e clicar nas categorias de dados econômicos correspondentes.
249. Estatísticas históricas.org
Historicalstatistics.org é um site extremamente útil para encontrar o tipo de informação econômica que apresenta um contraste interessante com o presente. Por exemplo, o conversor histórico de moeda do site permite aos pesquisadores descobrir quanto uma pessoa com US$ 10 em 1923 poderia comprar hoje. Também acolhe publicações e artigos que fazem perguntas sobre as métricas utilizadas no campo da história económica, juntamente com índices de preços e informações sobre a oferta monetária que podem ser filtrados por país.
E se todos os dados económicos públicos na Internet pudessem ser acedidos e pesquisados a partir de uma plataforma única e navegável? Db.nomics é um agregador de banco de dados econômico que busca fazer exatamente isso. Os dados estão disponíveis em formatos como HTML, JSON e CSV e são atualizados automaticamente enquanto as revisões anteriores são arquivadas adequadamente. As fontes económicas incluem a Reserva Federal, o Gabinete de Análise Económica, o Fundo Monetário Internacional e outros. Os pesquisadores que procuram dados econômicos confiáveis não podem errar com o Db.nomics.
251. Centro Conjunto da Dívida Externa (JEDH)
Desenvolvido através do trabalho conjunto do Banco de Compensações Internacionais, da Organização para a Cooperação e Desenvolvimento Económico (OCDE), do Fundo Monetário Internacional e do Banco Mundial, o Centro Conjunto da Dívida Externa torna acessíveis informações sobre dados da dívida e credores e devedores internacionais. o público. Jornalistas que analisam as finanças de diferentes nações e tentam obter uma compreensão mais profunda do cenário financeiro internacional encontrarão aqui praticamente tudo o que desejam saber.
252. Dados de comércio internacional
Juntamente com a contribuição completa de um importante especialista econômico, Jon Haveman, esta página de Dados de Comércio Internacional hospeda dados que podem ser baixados e analisados posteriormente. Os conjuntos de dados incluem dados tarifários, tabelas Penn World, serviços públicos, dados de importação, produtividade industrial, classificações de mercadorias, códigos de diferenciação de produtos Rauch, dados NBER, pesquisa de fluxo de mercadorias de 1997, comércio e imigração e o modelo gravitacional útil. UNIX é o sistema operacional usado para compilá-los, mas o site observa que os PCs também devem ter acesso aos dados.
253. Corporações Abertas
No OpenCorporates os pesquisadores têm o luxo de pesquisar e encontrar informações em um dos maiores bancos de dados abertos de empresas ao redor do mundo. Esta informação é então utilizada por diferentes grupos em todo o mundo, tais como bancos, investigadores, ONG e jornalistas, num esforço de inteligência e informação. Os jornalistas têm o benefício adicional de poder acessar os dados em tempo real com a ajuda da API OpenCorproates, bem como por meio de dados principais em massa ou outros conjuntos de dados principais.
254. Nosso mundo em dados
Our World in Data coleta informações de diversas fontes em diversas áreas e apresenta dados quantificados sobre elas. Desde números sobre a participação das mulheres na força de trabalho até informações sobre a percepção geral da corrupção no sector público e a desigualdade de rendimentos global, se o assunto puder ser discutido em termos de dados, este website poderá ter uma entrada para o mesmo. Os jornalistas podem usar esta fonte para encontrar estatísticas e números relacionados com questões sociais.
255. Ciência Po
Sciences Po, ou como é mais conhecido, Instituto de Estudos Políticos é uma escola que tem influência inegável nas ciências sociais. Neste caso, a página de Thierry Mayer inclui arquivos de dados que apresentam dados de regressões de gravidade e conflitos militares de “Make Trade Not War”, bem como conjuntos de dados sobre potenciais de mercado, entre vários outros. Os jornalistas que procuram compreender melhor as conclusões alcançadas nas revistas académicas irão descobrir muitas informações enquanto navegam neste site.
256. Centro de dados internacionais
Desde a sua estreia em 1999, o Centro de Dados Internacionais tem-se dedicado à sua missão de recolher, criar, melhorar e distribuir dados económicos internacionais, tanto offline como online. No site, os leitores acessam informações como dados tarifários dos EUA, importações e exportações mundiais e dos EUA e até informações da Penn World Table. Com esta informação disponibilizada ao público para educação e investigação, os jornalistas podem aceder e utilizar estes dados gratuitamente.
257. Observatório da Complexidade Económica
O Observatório da Complexidade Económica, vulgarmente referido como OEC, permite que investigadores, estudantes, economistas e qualquer outra pessoa visualizem dados do comércio internacional. Com seus temas atraentes e interface interativa, este site oferece aos pesquisadores uma oportunidade legítima de explorar informações sobre comércio internacional de maneiras nunca antes vistas. Para os jornalistas que gostam de ver os dados económicos ganharem vida à medida que os procuram, o OEC é um recurso inestimável.
258. Dados do scorecard da faculdade
O ensino superior é um tema quente em muitos círculos, com estudantes e famílias querendo saber como as escolas estão se saindo e quão bem os alunos estão aprendendo. Através dos dados do College Scorecard, o Departamento de Educação dos EUA fornece aos educadores e estudantes todas essas informações e muito mais. Esses números cobrem de 1996 a 2016 e incluem dados atuais, dados de scorecard e rendimentos pós-escolares, além de novas informações do Sistema Nacional de Dados de Empréstimos para Estudantes. É uma fonte de educação pós-secundária atualizada que os jornalistas deveriam usar.
259. Conjunto de dados de energia de edifícios comerciais
Como um conjunto de dados que trata principalmente de energia, o COMBED tem uma reivindicação automática de exclusividade. Acrescente o fato de que seus dados são renovados várias vezes por minuto enquanto vêm de um edifício comercial e fica claro que esse conjunto de dados é único. Para os jornalistas, esta informação é extremamente útil na preparação de um artigo sobre consumo de energia. Acessar os dados do COMBED é tão fácil quanto baixar e abrir uma planilha Excel.
260. Conjunto de dados DRED
A parte DRED do banco de dados DRED significa Conjunto de dados de energia residencial holandês. Como o título sugere, estes dados medem e estudam quanta energia uma única família holandesa irá consumir. Ambiência, ocupação, eletricidade e informações gerais do agregado familiar foram todas monitorizadas neste conjunto de dados de 5 de julho de 2015 a 5 de dezembro de 2015. Qualquer jornalista que pesquise o consumo de energia beneficiaria ao verificar os números brutos fornecidos aqui. As instruções para baixar os dados em CSV podem ser encontradas diretamente no site.
ECO, que significa Consumo e Ocupação de Eletricidade, é um projeto operado e executado pelo Grupo de Sistemas Distribuídos. A premissa deste projeto era que pesquisadores monitorassem as cargas e detectassem ocupações em seis domicílios suíços ao longo de 8 meses. Este site oferece acesso a essas informações, bem como instruções e links para publicações relacionadas. Graças ao painel visualmente interativo do site, os jornalistas não deverão ter problemas em traduzir a pesquisa em algo envolvente.
262. Conjunto de dados indiano para água e energia ambiental
IAWE, que significa Conjunto de dados indiano para água e energia ambiente, foi criado com o objetivo de monitorar o uso de energia de uma casa em Nova Deli com medições de eletricidade de eletrodomésticos, medidor de eletricidade e painel de circuito. Devido a interrupções, diferenças no fornecimento de água, quedas de pacotes e flutuações de tensão, o iAWE enfrentou problemas exclusivos para rastrear o uso de energia na Índia. Esses são dados extremamente úteis para os jornalistas ao discutirem padrões de uso de energia.
263. Eletricidade em nível de eletrodomésticos no Reino Unido
Eletricidade em nível de eletrodomésticos do Reino Unido, ou UK-DALE, é o nome dado a um conjunto de dados que monitora e registra quanta energia é demandada em um grupo de cinco residências. A cada seis segundos, o UK-DALE mede a procura tanto da rede eléctrica principal como dos aparelhos individuais da casa. Jornalistas interessados em ver como as famílias do Reino Unido usam a energia podem definitivamente usar o UK-DALE. Os dados são acessíveis e há um artigo descrevendo o sistema disponível para leitura.
264. ArcGIS
ArcGIS Hub é uma plataforma que organizações e indivíduos podem usar para atingir metas por meio de iniciativas em todo o site. Com modelos de páginas, guias passo a passo e exemplos disponíveis para visualização, este site é um excelente recurso para promotores sociais ambiciosos. Enquanto isso, as informações disponíveis na guia Dados Abertos hospedam centenas de conjuntos de dados apenas na categoria “Desastre”. Estejam os jornalistas pesquisando dados ou contribuindo com eles, o ArcGIS Hub é útil em mais de um aspecto.
265. SIG de Cambridge
Cambridge GIS é o repositório de dados abertos da cidade de Cambridge, Massachusetts. Com exceção dos arquivos que são grandes demais para serem baixados através deste repositório GitHub, a maioria dos conjuntos de dados da cidade podem ser encontrados nesta página. Os conjuntos de dados individuais disponíveis aqui incluem distritos comerciais, servidões, distritos de zoneamento, resultados de censos, cemitérios e outros pontos de referência e características que podem ser quantificados pelos dados. Um jornalista que procura informações locais encontrará tudo o que procura e muito mais neste site.
266. Geo-Wiki.org
Como recurso, o Geo-Wiki é um site dedicado ao que chama de “movimento da ciência cidadã”. Aqui, os cidadãos são incentivados a tentar monitorar o meio ambiente. Os pesquisadores podem encontrar as últimas notícias na barra lateral junto com os nomes das publicações e conjuntos de dados e downloads de software gratuitos. As ferramentas que o site disponibiliza incluem mapas, uploads de dados pessoais, validações e hackathons que podem ser baixados em formato Excel e arquivos zip.
267. OpenStreetMap
As extrações de dados do OpenStreetMap vêm do projeto OpenStreetMap, a tentativa on-line contínua de criar um mapa do mundo por meio de edições e esforços da comunidade global de usuários. Para começar a usar esta fonte de dados, tudo o que os editores de conteúdo precisam fazer é escolher o continente de sua preferência e, a partir desse ponto, encontrar o país de sua preferência. Não há taxas para baixar este Geofabrik GmbH e os dados são atualizados diariamente como regra geral.
Operado e mantido pelo Departamento de Segurança Interna, HIFLD, para dados em nível de fundação de infraestrutura interna, coloca dados geoespaciais em domínio público. Esses dados são distribuídos com o propósito expresso de fornecer suporte e informações para fins de pesquisa e preparação na comunidade. Esses dados podem ser baixados em Shapefile e CSV e também podem ser visualizados na web. Para os editores, o HIFLD Open Data torna os dados geoespaciais mais visuais e envolventes do que nunca.
269. Endereços abertos
OpenAddresses é especializada em infraestrutura e coleta de endereços. Alimentado em grande parte pela força dos esforços da comunidade, este site usa o GitHub como plataforma de desenvolvimento. Aqui, as pessoas podem colocar endereços em um mapa após adicioná-lo ao banco de dados ou podem pegar os dados e começar a geocodificação diretamente imediatamente. Com todos os dados e endereços abertos e exigindo mera atribuição, as atualizações regulares dos dados e o potencial para avanços na geocodificação tornam o OpenAddresses um projeto muito interessante.
270. LMU de dados abertos
Open Data LMU depende fortemente de dados do OpenStreetMap para auxiliar no desenvolvimento do Fast Reverse Geocoder. O que isto significa é que o aplicativo é capaz de obter rapidamente uma localização em um mapa e encontrar um endereço completo com base nesse ponto. Isso também poderia ser aplicado a bairros e condados. Esta página da web hospeda vários links relacionados ao aplicativo que incluem código-fonte, conjuntos de dados e tabelas de pesquisa e resoluções do OpenStreetMap.
271. Explorador de dados ambientais
Com o Environmental Data Explorer, jornalistas, investigadores e estudantes podem descarregar e explorar os mesmos conjuntos de dados que o Programa das Nações Unidas para o Ambiente utiliza juntamente com as suas organizações afiliadas e parceiros. As pesquisas podem ser restringidas por região e feitas usando um ou todos os 500 filtros. Além disso, os conjuntos de dados incluem categorias como saúde, PIB, clima, emissões e água doce que podem ser visualizadas diretamente no site em forma de gráfico, tabela ou mapa.
272. Grupo do Banco Africano de Desenvolvimento
O site do Grupo Banco Africano de Desenvolvimento é a primeira paragem de um jornalista quando procura informação estatística e indicadores relacionados com o continente africano. Os usuários que percorrem o catálogo de dados podem filtrar conjuntos de dados por origem, tópico e região. Para quem procura um conhecimento mais profundo do assunto em questão, o site também oferece links para uma lista impressionante de publicações que incluem títulos como Perspectivas Económicas Africanas e Anuário Estatístico Africano.
273. Commons de dados genômicos (GDC)
O Genomic Data Commons do NCI abriga um dos repositórios de dados de câncer mais completos da web, focado na área de estudos genômicos do câncer. O portal de dados deste site hospeda milhares de casos e cobre 38 tipos de doenças para acompanhar 39 projetos e é de acesso gratuito. Como os envios de dados são feitos principalmente por instituições e pesquisadores, a precisão dessas informações torna-as uma fonte de dados ideal para os jornalistas terem no bolso.
274. Bancos de dados PhysioBank
As bases de dados PhysioBank disponibilizam dados fisiológicos aos indivíduos através do domínio público. Esses bancos de dados são divididos em duas categorias maiores: forma de onda e clínica. Entre as subcategorias de formas de onda estão imagens, bancos de dados de intervalos entre batimentos, sintéticos, marcha e equilíbrio, ECG e bancos de dados multiparâmetros. Uma amostra da informação pura resultante disso inclui dados sobre sinais vitais à beira do leito, saturação de oxigênio e até mesmo doenças cardiovasculares. Jornalistas e indivíduos que pesquisam o corpo humano podem encontrar algumas informações aqui.
275. Banco de dados de cobertura do Medicare
O banco de dados Medicare Coverage, mantido pelos Centros de Serviços Medicare e Medicaid por meio do Departamento de Saúde e Serviços Humanos, oferece aos pesquisadores acesso total a uma tonelada de informações sobre serviços médicos. Há informações sobre condições crônicas, gastos com medicamentos, modelos clínicos eletrônicos, sistema de cobrança de dívidas e subsídios para pesquisa e demonstração para leitura. Para dados obtidos diretamente da fonte, este é o site on-line mais completo e abrangente desse tipo.
Conteúdo de nossos parceiros
276. Dados de pagamentos abertos
Quando a maioria das pessoas vai ao médico, normalmente não se senta para pensar se o seu médico de cuidados primários está ou não se beneficiando financeiramente depois de trabalhar com fabricantes de serviços de saúde. O Open Payments informa o público sobre quaisquer refeições, pesquisas, presentes, taxas de palestras e despesas de viagem que o médico ou hospital tenha recebido das empresas. Jornalistas em busca de uma história contundente podem usar o explorador de dados para visualizar as informações ou clicar na guia para baixar os dados diretamente.
277. Flickr Logos
Está parcialmente escrito no nome, mas FlickrLogos se refere a um conjunto de dados que consiste em logotipos de empresas que foram fotografados em diversas posições diferentes. Mantida pelo Laboratório de Computação Multimídia e Visão Computacional da Universidade de Augsburg, esta coleção foi originalmente compilada com a intenção de treinar computadores para reconhecer logotipos e textos. Para ficar por dentro de qualquer progresso feito com este programa interessante, não custa nada baixar este conjunto de dados e ver do que se trata.
278. ImageNet
ImageNet é um banco de dados repleto de imagens organizadas pela WordNet. Existem desafios anuais no site que podem ser visualizados mesmo após o fechamento e são focados na criação de algoritmos capazes de realizar tarefas específicas. ImageNet também abriga inúmeras publicações, citações e slides. Os editores de conteúdo voltados para a tecnologia teriam todos os motivos para usar a opção do explorador para entender a estrutura do WordNet, bem como o mapa da nuvem.
279. Conjunto de dados de cães de Stanford
O conjunto de dados Stanford Dogs contém toneladas de fotos e imagens de diferentes raças de cães. Com 120 raças diferentes de cães incluídas, juntamente com mais de 20.000 imagens individuais, este banco de dados alimentado pela ImageNet oferece aos pesquisadores muitas imagens para trabalhar enquanto ensina às máquinas como reconhecer cada raça de cão. No site, links para diversas publicações que discutem o uso de conjuntos de dados para ensinar computadores sobre reconhecimento de imagens podem ser clicados e lidos junto com o download do conjunto de dados.
280. Banco de dados SUN
A base de dados SUN é o local de um projeto elaborado para que a comunidade de investigação faça progressos em áreas como visão computacional e gráficos, mineração de dados, aprendizagem automática e neurociência, entre outras. Com mais de 131.000 imagens e quase 4.000 categorias de objetos em seus índices, este site é tão abrangente quanto possível. Para editores interessados neste banco de dados e no que os pesquisadores conseguiram fazer ao usá-lo, esta é uma fonte de dados que vale a pena explorar.
281. O conjunto de dados de animais de estimação Oxford-IIIT
O Oxford-IIIT Pet Dataset é um site que funciona como um complemento a um artigo publicado na Conferência IEEE sobre Visão Computacional e Reconhecimento de Padrões de 2012 e hospeda o conjunto de dados original que foi usado para os fins do artigo. Essas imagens foram organizadas em aproximadamente 37 categorias de animais de estimação para acompanhar outras 200 imagens associadas a cada turma envolvida. Além disso, esses dados podem ser baixados diretamente através dos links da página web.
282. O conjunto de dados do genoma visual
A API Visual Genome é o resultado final do trabalho árduo realizado por vários estudantes e professores associados da Universidade de Stanford. Com vários artigos em seu nome na busca pela criação de uma API capaz de avaliar e descrever imagens, o programa respondeu com sucesso a mais de um milhão de perguntas enquanto avaliava mais de 100.000 imagens. Esta API representa avanços na área de ciência da computação e áreas afins e o conjunto de dados pode ser baixado diretamente no site.
283. Rostos do YouTube
O YouTube Faces Database está focado no desenvolvimento de uma solução para o problema do reconhecimento facial automático em vídeos. Ao todo, o conjunto de dados possui mais de 3.000 vídeos retirados do YouTube de quase 1.600 indivíduos com duração média de aproximadamente 181 frames. Em última análise, o objetivo é criar um algoritmo capaz de criar rótulos que identifiquem a pessoa que está no vídeo. Os dados junto com as informações sobre os erros, bem como os métodos de descrição estão todos disponíveis para visualização diretamente no site.
284. Repositório de conjunto de dados KEEL
O repositório do conjunto de dados KEEL contém o conjunto de dados de software de código aberto baseado em Java projetado para auxiliar em vários tipos de descoberta de dados de conhecimento. KEEL, conhecido simplesmente como Extração de Conhecimento Baseada em Aprendizagem Evolucionária, pode ser treinado para aprender como adicionar valores ausentes, modelos híbridos e métodos estatísticos para avaliar experimentos, entre uma série de outras tarefas. Os downloads do conjunto de dados, bem como uma lista completa dos algoritmos apresentados no KEEL, podem ser baixados diretamente do site.
285. Clube de Empréstimos
A fama do Lending Club é seu status de credor peer-to-peer que permite que os mutuários recebam empréstimos mesmo quando não têm necessariamente a pontuação de crédito para pedir empréstimos de credores tradicionais. Junto com os aspectos inovadores de como o site opera, ele também fornece estatísticas que incluem destaques da plataforma, informações sobre empréstimos recusados, números de desempenho dos investidores e até mesmo um dicionário de dados que contém dados históricos. Esses números geralmente começam em 2007 e podem ser baixados em CSV.
286. Museu de História Natural
O Museu de História Natural é considerado por muitos um dos museus mais reconhecidos do mundo, mas a digitalização e a possibilidade de examinar o seu catálogo através do portal de dados abertos seriam provavelmente novidade para muita gente. Com 91 conjuntos de dados que incluem coleções de microfósseis e fósseis, bem como registros de lotes de índices, entre outros materiais, os dados estão abertos ao público e podem ser baixados gratuitamente em vários formatos.
Este site é perfeito para jornalistas e editores que desejam seguir certas diretrizes de estilo ao descrever e categorizar determinadas artes, nomes de artistas, arquitetura, materiais e nomes geográficos. Este site conecta os usuários diretamente aos bancos de dados de vocabulário controlado que os pesquisadores e catalogadores precisam conhecer para atender aos padrões internacionais. Aqui, pelo menos, não há como superar os Vocabulários Getty. Os conjuntos de dados podem ser explorados através de texto ou SPARQL e podem ser baixados através do site.
288. Corpus de investigação de estilometria CLIPS (CSI)
O corpus de investigação de estilometria CLIPS provavelmente não é o que a maioria das pessoas pensa quando ouve as palavras CSI, mas o corpus CSI é, mesmo assim, um conjunto de dados composto de avaliações e redações de alunos. Além do texto em si, a presença de metadados e informações embutidas no documento são apontadas pelo site como tendo múltiplas utilizações. Oferecido e distribuído sob a licença Creative Commons, tudo o que o corpus pede em troca do uso do conjunto de dados é uma atribuição.
289. Dependências Universais v2
Universal Dependencies v2 refere-se à segunda versão atualizada do projeto Universal Dependencies, um esforço para desenvolver uma anotação treebank que pode ser usada consistentemente com vários idiomas diferentes. Na versão atualizada, os pesquisadores encontrarão dezenas de bancos de árvores UD para diferentes idiomas, incluindo africâner, grego antigo, japonês, holandês, finlandês e chinês, além do inglês. A versão mais recente das Dependências Universais pode ser encontrada e baixada na parte inferior desta página da web.
290. Mangueira de teia
Webhose é uma fonte de primeira linha de conjuntos de dados retirados diretamente dos repositórios do site e abertos ao público. Os pesquisadores podem classificar artigos de notícias por idioma, sendo árabe, francês e holandês apenas alguns dos idiomas com números de artigos superiores a 100.000. Além disso, os artigos de notícias em inglês são divididos em categorias como entretenimento e esportes, para acompanhar as resenhas e postagens no fórum. Editores e pesquisadores digitais podem se beneficiar da exploração desses conjuntos de dados.
291. Dados Wiki
O Wikidata é uma fonte subestimada de conteúdo e ideias tanto para editores quanto para pesquisadores. De acordo com esta página, existem diversas formas de acessar o material nos data dumps, embora o uso de JSON seja o mais recomendado pelo site. Disponíveis e totalmente gratuitos para uso comercial e não comercial, todos os dados aqui disponíveis podem ser acessados e baixados gratuitamente sob a licença Creative Commons.
292. Links Wiki
Situado confortavelmente na estrutura do Google Code, o Wiki Links é um projeto de código aberto que busca fornecer aos indivíduos acesso a esse conjunto de dados exclusivo e específico. Nesta página, os pesquisadores podem baixar os textos README, os arquivos de dados e a licença Creative Commons. Os editores ou indivíduos geralmente voltados para a tecnologia têm muito o que esperar ao examinar esse enorme conjunto de dados. Basta navegar pelo site, clicar e iniciar o download dos arquivos.
293. WordNet
WordNet é um léxico inglês composto por componentes da linguagem, advérbios, substantivos, adjetivos e verbos que são categorizados em agrupamentos distintos que são então usados para expressar ideias específicas. O resultado final é uma ferramenta útil que categoriza as palavras pela forma como são usadas e pelo que significam, em vez de como soam quando são pronunciadas. As aplicações do WordNet na programação linguística são destacadas juntamente com as inúmeras publicações e estatísticas disponíveis no site.
294. Allen Cérebro Atlas
O Allen Brain Atlas, criado pelo Allen Institute for Brain Science Resources, é uma ferramenta para estudar e aprender mais sobre o cérebro humano e como ele responde quando o corpo humano está saudável e também quando há doença. Usando o atlas, os pesquisadores podem aprender sobre o cérebro humano e seu desenvolvimento, bem como sobre o glioblastoma e o efeito do câncer no cérebro. Jornalistas que cobrem esses tópicos podem visitar este site para obter conjuntos de dados e informações.
295. NITRC
O NITRC, ou Clearinghouse de Ferramentas e Recursos de Informática de Neuroimagem, é onde jornalistas e editores podem procurar neuroimagem. Reunido e promovido como uma iniciativa para compartilhamento de dados de neuroimagem, este site abriga dados de vários projetos, como o Projeto 1000 Connectome, a Addiction Connectome Preprocessed Initiative, bem como os projetos INDI-Prospective e Retrospective, respectivamente. Os indivíduos são livres para baixar os dados através do site. As neuroimagens obtidas em vários estágios nunca foram tão acessíveis.
296. HCP Jovem Adulto
O projeto Jovem Adulto do Human Connectome Project é uma continuação do esforço contínuo para criar um mapa preciso do conectoma humano como seria visto na maioria dos adultos normais. Através de duas fases, 1.200 adultos saudáveis foram examinados através de uma combinação de técnicas de fMRI em estado de repouso e imagens de difusão. Jornalistas e editores em busca de informações sobre o cérebro não encontrarão outro site com mais dados sobre o conectoma humano em jovens adultos saudáveis.
O NIMH Data Archive, ou NDA, abreviadamente, não é tanto uma fonte de dados independente, mas uma plataforma para distribuição e armazenamento de dados. Neste site, há dados que foram coletados ao longo de vários artigos e projetos de pesquisa, bem como o fornecimento de métodos e ferramentas que permitem uma melhor análise e colaboração. Os resumos de dados estão disponíveis gratuitamente e os provedores de conteúdo que relatam o que há de mais recente na ciência podem usar essas informações para dar notícias.
298. Neurodados
A NeuroData se dedica a conduzir pesquisas sobre a relação única entre a mente e o cérebro. Graças ao compromisso do site com a ciência aberta e a pesquisa reproduzível, os provedores de conteúdo têm acesso a uma publicação e a diversos conjuntos de dados que podem ser acessados seguindo os links da página web. De particular interesse para aqueles que desejam ver os dados por si próprios é a disponibilidade de código gratuito e ferramentas de análise que tornam a exploração do trabalho da NeuroData ainda mais simples.
299. NeuroEletro
O Projeto NeuroElectro foi concebido com o intuito de coletar as diversas características eletrofisiológicas associadas a diferentes tipos de neurônios e agregá-las em um único banco de dados. Este projeto busca estudar a relação entre neurônios em um esforço para estudar as diferenças entre vários tipos de neurônios. O site tem links para artigos e lista os tipos de neurônios e propriedades eletrofisiológicas descobertas até agora. Os provedores de conteúdo podem contar com este site como fonte de dados sobre relacionamentos entre neurônios.
300. Série de estudos de imagem de acesso aberto
A Série de Estudos de Imagens de Acesso Aberto, também conhecida por muitos como OASIS, é um projeto que foi concebido com o objetivo de tornar conjuntos de dados de ressonâncias magnéticas cerebrais acessíveis à comunidade científica em geral. Jornalistas e pesquisadores podem acessar publicações que comparam dados de ressonância magnética entre adultos, bem como uma ficha informativa abrangente do artigo abrangente do OASIS comparando e contrastando resultados de mais de 400 indivíduos. As informações e ferramentas podem ser baixadas do site em diversos formatos.
301. OpenfMRI
Para jornalistas que desejam acessar conjuntos de dados de ressonância magnética sem qualquer incômodo associado a outros sites, o foco do OpenfMRI.org em tornar os conjuntos de dados de ressonância magnética acessíveis ao público é um desenvolvimento positivo. Vindo diretamente dos próprios pesquisadores, este site hospeda uma variedade de conjuntos de dados, como o conjunto de dados de aprendizagem de classificação, a tarefa de apostas mistas e a tarefa de tomada de risco analógica de balão. A variedade e a quantidade de dados permitem que os pesquisadores encontrem novos caminhos de investigação através deste site.
302. Estudeforrest
Tomando emprestado seu nome do famoso filme Forrest Gump, o studyforrest busca entender do que o cérebro é capaz quando precisa ter um desempenho de alto nível enquanto enfrenta uma estimulação natural, mas igualmente complexa. Mesmo assim, o site reconhece que a quantidade de dados de fMRI recolhidos nestes estudos tem aplicações mais amplas do que parece à primeira vista. Os provedores de conteúdo podem navegar pelas 19 publicações que utilizaram do studyforrest e podem até acessar os dados diretamente.
303. Banco de dados aberto de cristalografia
Como seria naturalmente esperado do título, o Banco de Dados Aberto de Cristalografia é uma coleção de 385.697 minerais e compostos metal-orgânicos, estruturas cristalinas orgânicas e inorgânicas, com a notável exceção de biopolímeros. Os provedores de conteúdo que desejam aprender mais sobre estruturas cristalinas podem pesquisar pela fórmula estrutural ou executar uma consulta de pesquisa correspondente com a opção de navegar. Há também software e dados neste site que o tornam especialmente valioso no campo da química.
304. Arquivo de Exoplanetas da NASA
Há muito considerada uma das principais fontes de informação sobre o espaço exterior, a NASA continua a sua tradição de ser um recurso inestimável com o seu arquivo de Exoplanetas. Este site hospeda uma série de ferramentas e softwares interativos, como o Serviço de Trânsito e Efemérides, o Periodograma, a Ferramenta de Plotagem de Planetas Confirmados e a capacidade de fazer upload interativo de arquivos e tabelas de pesquisa. Os provedores de conteúdo que buscam insights exclusivos podem usar esses dados para fazer isso na próxima vez que os exoplanetas forem grandes notícias.
305. Pesquisa Digital do Céu Sloan
A capacidade de criar mapas tridimensionais do Universo é possível para qualquer pessoa com a ajuda do Sloan Digital Sky Survey, ou SDSS. Repórteres e fornecedores de conteúdo podem acessar algoritmos, dados de imagens, conjuntos de dados, tutoriais e desenvolvimento adicional de materiais visuais para fins de educação do público, tanto formal quanto informalmente. O site também discute explicitamente a disponibilização de seus dados ao público por meio de notícias e mídias sociais. Esta é uma ferramenta visual inestimável para provedores de conteúdo.
306. StatSci.org
Statsci.org oferece uma lista abrangente de recursos que o público pode acessar e utilizar dependendo de suas necessidades específicas. Algumas das informações incluem o Electronic Dataset Service e estudos de caso compilados pela UCLA. Junto com os conjuntos de dados brutos, também há livros didáticos vinculados nesta página. Isso inclui títulos como Manual de Pequenos Conjuntos de Dados e Estudos de Caso em Biometria. Os provedores de conteúdo em busca de estatísticas não podem errar ao dar uma olhada.
307. Eric
O ERIC, também conhecido como Instituto de Ciências da Educação, é um recurso que funciona como motor de busca para quem procura informação na área da educação. A pesquisa preliminar oferece ainda a opção de filtrar exclusivamente informações revisadas por pares, bem como textos completos baseados no ERIC. Tendo em conta a frequência com que os orçamentos da educação e os métodos de ensino parecem aparecer nas notícias, esta é uma fonte de dados que os jornalistas devem ter em mente.
308. Núcleo de Comunicação Social
Criado logo após o fim da Segunda Guerra Mundial, o NTIS (Serviço Nacional de Informações Técnicas) foi formado com o objetivo de usar dados para ajudar as agências federais a tomar decisões informadas e baseadas em dados por meio do uso de dados. Esta agência era originalmente o repositório de dados do governo dos EUA na área de investigação científica. Hoje, o site hospeda milhões de publicações sobre uma infinidade de assuntos. A informação histórica por si só torna este site merecedor como fonte de dados para jornalistas e editores.
309. Certificado de dados abertos
O site do ODI (Open Data Institute) abriga o chamado Certificado de Dados Abertos, que é uma ferramenta gratuita disponível online que foi desenvolvida com o propósito expresso de examinar criticamente e reconhecer a qualidade dos dados abertos. Do ponto de vista de um editor ou jornalista, o site também hospeda numerosos conjuntos de dados sobre assuntos que vão desde listas de bolsas até alertas de alergia, além de listas que podem ser baixadas em formato CSV.
310. Arquivo GitHub
GitHub é facilmente um dos repositórios de dados e arquivos mais populares e conhecidos da Internet devido à sua facilidade de colaboração, capacidades de arquivo e acessibilidade no que diz respeito à codificação. Quer se trate de tentativas de criar bots que possam executar determinadas tarefas ou de desenvolver aplicativos, o GitHub é um site onde editores de conteúdo e jornalistas podem facilmente encontrar produtos potencialmente interessantes. O arquivo pode ser acessado seguindo as instruções do tutorial para JSON ou Big Query.
311. SocioPadrões
SocioPatterns é um projeto focado em encontrar padrões na atividade humana e na dinâmica social por meio de dados. Como é esperado com um objetivo tão amplo, as informações do site têm sido utilizadas em publicações que abordam uma variedade de assuntos, desde a propagação de doenças até estudos de caso sobre as diferenças entre as personas online e offline dos indivíduos. Os conjuntos de dados estão disponíveis para visualização, assim como os artigos publicados contendo informações que os editores provavelmente acharão relevantes em um ponto ou outro.
312. Mapa Indie
O Indie Map é o resultado da coleta de informações de mais de 2.000 dos sites mais movimentados do IndieWeb e da distribuição dos dados em formatos visuais interativos, como uma API Social Graph, um conjunto de dados com recursos de consulta SQL e as informações brutas que foram rastreadas em um total de 5,7 milhões de páginas da web. Os editores digitais interessados em software de código aberto e no que esses dados podem dizer sobre essas comunidades online podem acessar as informações diretamente do site.
313. Universidade Simon Fraser
Simon Fraser continua a construir o seu estatuto de universidade respeitável com a disponibilidade do seu conjunto de dados relativos às “Estatísticas e Rede Social de Vídeos do YouTube”. Extraindo informações de um rastreador que usou a API do YouTube para encontrar vídeos, os arquivos contêm dados sobre milhões de vídeos e conjuntos de dados de informações do usuário. O site especifica que os downloads de conjuntos de dados são apenas para fins acadêmicos, mas pode ser possível encontrar fontes jornalísticas e referências sobre este projeto através do site.
314. ACLED
ACLED, ou Projeto de Localização de Conflitos Armados e Dados de Eventos, oferece dados públicos sobre protestos e violência política no mundo em desenvolvimento. A informação aqui fornecida inclui números de vítimas mortais, informações sobre as datas e locais da violência ou protesto, nomes dos grupos relevantes e dados sobre motins e confrontos violentos que ocorreram. ACLED fornece acesso a relatórios regulares, publicações e recursos visuais, bem como a dados disponíveis para download no site.
315. Instituto Canadense de Informação Legal
O Canadian Legal Information Institute, ou CanLII, como é chamado na linguagem comum, é um site que fornece acesso gratuito a estátuas e seus regulamentos, jurisprudência de tribunais de várias jurisdições, incluindo a Suprema Corte do Canadá, os tribunais provinciais e de apelação e o Queen's Tribunal, juntamente com decisões de vários tribunais administrativos e órgãos estatutariamente criados. Com 301 bases de dados de jurisprudência e mais de 140.000 decisões judiciais disponíveis para visualização, jornalistas e editores digitais que cobrem tópicos jurídicos beneficiariam se adicionassem este site aos favoritos.
316. Centro para a paz sistêmica
O Centro para a Paz Sistêmica, ou CSP, é uma organização que se dedica à análise de sistemas globais com o propósito de abordar a questão da violência política. Neste site, os jornalistas que realizam investigação nesta área terão acesso a análises sobre conflitos em África, tendências de conflitos a nível global, entre outros, juntamente com resumos das três principais publicações da organização, como a Terceira Guerra Mundial e o Relatório Global e Virtual do CSP. Biblioteca.
317. Projeto Correlatos de Guerra
O foco do projeto Correlates of War, ou COW, é auxiliar na coleta e distribuição de dados quantitativos, como na área de relações internacionais. Mantendo o seu compromisso de aplicar princípios científicos aos dados de relações internacionais, o COW torna os seus conjuntos de dados acessíveis gratuitamente ao público. Estas bases de dados contêm números sobre informações que jornalistas e investigadores podem utilizar, tais como conflitos militarizados entre estados, membros do sistema estatal, capacidades materiais nacionais e alianças formais.
A Pesquisa Social Europeia, ou ESS, é uma pesquisa realizada em toda a Europa com o objetivo de medir os vários padrões de comportamento, atitudes e crenças de diferentes populações em vários países. Uma vez que os jornalistas estão frequentemente interessados em obter a opinião do público, a série ESS Topline que cobre assuntos que vão desde o bem-estar pessoal e social dos europeus, atitudes em relação ao bem-estar e até mesmo a presença do preconceito de idade no Reino Unido, pode reforçar uma história de forma mais maneiras do que uma.
319. Fundo para a Paz
O Fundo para a Paz é uma organização que se concentra na prevenção de conflitos e na segurança através do desenvolvimento de ferramentas que podem ser utilizadas para mitigar conflitos. Ao longo da carreira do FFP, trabalhou em parceria com jornalistas, ONG, organizações locais e seus homólogos internacionais, bem como governos. Seja em busca de tendências, análises comparativas e dados globais, jornalistas e editores podem encontrar os materiais que desejam por meio da ferramenta de exploração de dados no navegador do site.
O trabalho da Pesquisa Social Geral (GSS) concentra-se na coleta de informações sobre vários aspectos da sociedade americana moderna como forma de se manter atualizado sobre as tendências e padrões de atitude e comportamento da população. Com esta prática de acompanhamento de tendências que remonta a 1972, os dados históricos por si só são uma mina de ouro para jornalistas que desejam explorar tendências. Usando o GSS Data Explorer, pesquisadores e jornalistas podem baixar, examinar e até avaliar dados.
321. Gesis
GESIS é um instituto alemão de infraestrutura dedicado às ciências sociais. Oferece diferentes ciências sociais, juntamente com trabalhos de pesquisa e serviços que vão desde metodologia de pesquisa até ciência da computação aplicada, coleta de dados, planejamento de estudos e análise de dados, para citar algumas das coisas que o GESIS faz. Jornalistas interessados em assuntos como a abordagem metodológica do GESIS, a utilização de imigrantes superqualificados e muito mais podem encontrar muitas informações na seção de publicações.
322. Futuros Religiosos Globais
Desde temas como o aborto até à educação sexual, a religião é tão difundida que, mesmo em países largamente seculares, a posição de uma pessoa em assuntos sociais difíceis pode ser influenciada pela crença religiosa. Em Global Religious Futures, o Pew Research Center examina tendências nas atitudes e crenças das pessoas no que se refere às religiões globais. Jornalistas que desejam examinar detalhes como a influência do evangelicalismo na política ou atitudes em relação ao apedrejamento podem usar o Data Explorer para encontrar respostas nos números.
323. Índice para gerenciamento de risco
O Índice de Gestão de Riscos, também conhecido como INFORM, é um local onde investigadores e jornalistas podem recorrer para avaliações de risco em situações em que existe risco de crise humanitária ou desastre. A organização oferece links para dados sobre temas como taxas de mortalidade infantil, índice de desigualdade de género e frequência de secas, entre outros números. Também é possível visualizar e baixar os dados do INFORM ou acessá-los através do mapa interativo do site.
324. INED
O INED, ou Instituto Francês de Estudos Demográficos, é uma das fontes mais prolíficas de dados e estatísticas que um jornalista pode encontrar na Internet. Com mais de 70 publicações sendo pesquisadas e publicadas a cada ano para acompanhar a população mundial em formato de gráfico, bem como estatísticas que medem questões como diferença de fertilidade entre os sexos para acompanhar notícias e métodos de recursos. Os investigadores que procuram resultados precisos provenientes de uma fonte respeitável irão encontrá-los no INED.
325. Arquivo de Redes Internacionais
O Arquivo de Redes Internacionais de Princeton oferece uma combinação única de publicações, com pesquisas como o Relatório de Desenvolvimento Humano de 1999 e Redes Globais: Um Jornal de Assuntos Transnacionais disponíveis para leitura neste site. Neste site, os jornalistas poderão debruçar-se sobre os dados históricos e atualizados públicos abrangentes do arquivo. Os assuntos abordados aqui incluem saúde, armas, livros, música, migração, regiões, Internet, política e transporte são apenas uma amostra dos materiais que os pesquisadores podem ler aqui.
326. Programa Internacional de Pesquisa Social
Fundado desde o início como um meio de colaboração entre pessoas de diferentes nações, o Programa Internacional de Pesquisa Social (ISSP) realiza pesquisas todos os anos sobre uma variedade de assuntos que são importantes na área das ciências sociais. Os tópicos ao longo dos anos incluíram desigualdade social, identidade nacional, cidadania, redes sociais e orientação profissional, entre outros assuntos. As conclusões do ISSP podem ser pesquisadas por ano ou por tópico e podem ser baixadas de acordo no site.
327. Associações de Estudos Internacionais
Jornalistas ou outros pesquisadores que buscam discussão intelectual e informativa sobre questões relacionadas a assuntos transnacionais, internacionais e globais, a Associação de Estudos Internacionais (ISA) reúne a experiência de pesquisadores, acadêmicos e especialistas em políticas entre outros nomes. A Enciclopédia de Estudos Internacionais da ISA apresenta ensaios revisados por pares repletos de discussões aprofundadas sobre tópicos relativos à pesquisa neste campo, bem como ensaios que fornecem informações contadas de uma perspectiva mais histórica.
328. Dados transnacionais na Web
A página incrivelmente útil do professor James W. McGuire da Wesleyan's University, apropriadamente intitulada Cross-National Data on the Web, é uma página de recursos cheia de links para dados relevantes de desenvolvimento econômico e global. Entre os conjuntos de dados que os jornalistas poderão descobrir aqui, há dados sobre planeamento familiar, desempenho educacional, subnutrição, água e saneamento, orientação para o mercado livre e informações específicas para a América Latina e as Caraíbas, para citar apenas alguns da lista. As fontes de dados listadas aqui são impecáveis.
329. Centro Norueguês de Dados de Pesquisa
O Centro Norueguês de Dados de Pesquisa é uma instituição que apoia e auxilia pesquisadores em diferentes áreas de realização de pesquisas empíricas, como privacidade, coleta e análise de dados, avaliação de metodologia e ética em pesquisa. Aqui, os pesquisadores encontrarão softwares e ferramentas desenvolvidos e recomendados pelo centro para acompanhar um extenso acervo de dados regionais, individuais e institucionais que podem ser acessados gratuitamente. As conclusões do centro no Relatório Anual de Pesquisa e Privacidade também são sempre uma leitura interessante.
330. IPUMS
O IPUMS não é necessariamente uma fonte de dados no sentido que a maioria das pessoas esperaria ao ouvir o termo, mas não deixa de ser uma fonte útil para jornalistas devido ao seu papel como agregador, arquivador e organizador dos dados que outras entidades lhe fornecem. Caso em questão, o IPUMS USA funciona como uma espécie de repositório de dados para microdados do censo dos EUA, com dados que remontam a 1790 e datam até ao presente.
331. ND-GANHO
O Índice de País ND-GAIN, uma iniciativa organizada pela Iniciativa de Adaptação Global da Universidade de Notre Dame, mede a resiliência de um país às alterações climáticas e outras forças da globalização. Este índice inclui pontuações de vulnerabilidade em áreas como alimentação, saúde, infraestruturas e ecossistemas, bem como pontuações de prontidão para até 500.000 pontos de dados. Contendo duas décadas de dados dos anos de 1995 a 2014 na forma de arquivos CSV, essas informações estão disponíveis para download.
Neste site, jornalistas e editores podem acessar dados abertos sobre a situação do policiamento e da criminalidade no Reino Unido. Os dados contêm estatísticas úteis sobre equipas de bairro, forças policiais individuais, números de paragens e buscas, bem como estatísticas sobre crimes e resultados. Usando este site, os jornalistas podem fazer comparações entre as forças policiais e identificar tendências na justiça criminal. Obter informações é tão simples quanto escolher o intervalo de datas, escolher a força policial e aguardar o arquivo.
333. Página geral de dados internacionais de Paul Hensel
A Página Geral de Dados Internacionais de Paul Hensel é uma série de links agrupados sob os títulos Estados e Sistema Internacional, Dados Geográficos Internacionais, Capacidades Estaduais, Coletas de Dados de Ciências Sociais e Alianças, Tratados e Organizações. Cada recurso listado nesta página contém dados de última geração que darão automaticamente credibilidade ao trabalho de um jornalista. Essas fontes podem incluir qualquer coisa, desde software até conjuntos de dados e arquivos, mas todos os links incluídos aqui são úteis.
334. TRAC
No mundo pós-11 de setembro, o terrorismo e os seus efeitos devastadores sobre as populações locais têm recebido muita atenção na mídia. TRAC, em trackterrorism.org, fornece aos pesquisadores análises e informações extensas sobre esses assuntos. Este site contém informações sobre milhares de grupos terroristas diferentes. O preço de US$ 500 para usuário único pode ser um pouco exorbitante no início, mas vale bem o preço pago por aqueles que escrevem sobre a violência e a guerra ao terror.
335. Departamento de Justiça Criminal do Texas
Interessado no funcionamento interno do sistema de Justiça Criminal do Texas? Curioso para saber quem está atualmente no corredor da morte? O Departamento de Justiça Criminal do Estado do Texas tem muitas informações provenientes dos últimos depoimentos de prisioneiros antes da execução, estatísticas do corredor da morte por gênero e raça, bem como outras estatísticas e fichas informativas sobre execuções. O Departamento de Justiça Criminal do Texas é a fonte mais confiável possível para jornalistas.
336. Sistema Integrado de Organizações da Sociedade Civil
O Sistema Integrado de Organizações da Sociedade Civil, ou iCSO, foi concebido para facilitar a comunicação das organizações da sociedade civil com o Departamento de Assuntos Económicos e Sociais. Além da eficácia da estrutura robusta, a página web inclui conjuntos de dados e categorias para mais informações. Os dados podem ser classificados por setor, tipo de organização, região envolvida e status ECOSOC da organização. Esta é uma fonte de dados que os jornalistas podem definitivamente usar para encontrar fontes.
337. Universidades em todo o mundo
Universities Worldwide é um banco de dados de universidades de todo o mundo que pode ser pesquisado para obter mais informações. A busca pode ser feita por listagem mundial ou filtrada exclusivamente para universidades dos Estados Unidos, e os usuários também podem adicionar seus próprios links no processo. Os editores de dados com um contingente considerável de estudantes, ou mesmo jornalistas que desejam verificar um fato, podem se beneficiar com a possibilidade de acessar um banco de dados como este sob demanda.
338. Programa de dados de conflito de Uppsala
Este é o site do Programa de Dados de Conflitos de Uppsala, que é um dos mais conhecidos fornecedores de informações sobre violência organizada. Ao longo dos últimos 40 anos do programa, este também se estabeleceu pelo seu trabalho na recolha de dados sobre a guerra civil. Os jornalistas podem utilizar esta fonte de dados para procurar informações sobre conflitos específicos e intervenientes nesses conflitos e também podem aceder a estes dados para efeitos de download.
339. Pop mundial
O projecto WorldPop, resultado final da fusão dos projectos AsiaPop, AfriPop e AmeriPop, dedica-se ao arquivamento de conjuntos de dados demográficos espaciais que, por sua vez, têm aplicações como meio de fornecer apoio aos esforços de socorro em catástrofes. Editores de conteúdo e jornalistas envolvidos em causas de justiça social ou que de outra forma pesquisam oportunidades eficientes de ajuda humanitária em desastres estariam interessados neste projeto. Os pesquisadores podem baixar os dados ou revisar os estudos de caso online.
340. Rascunho Expresso
O DraftExpress é talvez mais conhecido na Internet por suas pesquisas, relatórios de observação pré-draft, escolhas simuladas de draft e sua manutenção meticulosa das alturas e medidas dos jogadores para acompanhar seus dados históricos. As perspectivas mencionadas neste site vêm da NCAA, do ensino médio e até de ligas internacionais. Jornalistas esportivos ou provedores de conteúdo que pretendem oferecer comentários relacionados ao basquete podem recorrer às estatísticas do DraftExpress enquanto discutem jogadores e eventos à medida que ocorrem no esporte.
341. Betfair
A Betfair é talvez mais conhecida como o site ideal para apostas esportivas. Contudo, é de interesse particular para os fornecedores de conteúdo e para os editores digitais a disponibilidade de informações históricas detalhadas sobre os dados e o histórico de preços do site. Os dados podem ser acessados e baixados com ou sem o carimbo de data/hora detalhado, ao mesmo tempo que oferecem dados extensos sobre corridas de cavalos e outras ofertas de mercado do site, do ano de junho de 2004 a outubro de 2017.
342. FOLHA DE CRÍTICOS
O Cricsheet oferece um serviço semelhante a vários outros centros de dados esportivos, mas é um site especializado exclusivamente no fornecimento de dados de críquete. O site oferece estatísticas e dados bola a bola de várias ligas, incluindo a Premier League indiana, partidas internacionais de um dia, bem como números de times masculinos e femininos, para citar apenas algumas das categorias maiores. Os editores de conteúdo em busca de dados históricos de críquete podem baixar os dados em formato CSV ou XML.
343. Dados transnacionais de séries temporais
Com dados políticos, económicos, legislativos e de conflitos domésticos cobrindo mais de 200 anos de dados em mais de 200 nações em todo o mundo, o Cross-National Time-Series Data Archive é um dos conjuntos de dados mais abrangentes da Internet. Os dados são armazenados, de forma mais conveniente, em uma planilha do Google Drive que abre automaticamente ao clicar na categoria do arquivo. Em troca de uma citação, essas informações podem ser visualizadas parcial ou totalmente dependendo da necessidade do pesquisador.
344. Ford GoBike
Ford GoBike é o nome do programa de compartilhamento de bicicletas usado na Bay Area. Embora muitas pessoas estejam, sem dúvida, usando este programa para manter a forma e evitar o uso de combustíveis fósseis, o sistema de compartilhamento de bicicletas tem monitorado os dados da viagem. É claro que essas informações não incluem nada que possa identificar os ciclistas, mas detalhes como número da bicicleta, horário de início, horário de término, tipo de ciclista e estações de chegada e partida estão incluídos nos dados. Vale a pena explorar.
345. Tráfego Marítimo
A Marine Traffic é uma empresa que rastreia e acompanha movimentos de embarcações e viagens oceânicas utilizando big data. O tipo de informação coberta pelos serviços AIS API da Marine Traffic incluía embarcações, informações sobre as viagens e dados sobre as embarcações em questão, tais como chegadas previstas, até mesmo incidentes, fotos, detalhes da embarcação e previsões de viagem. Existem planos de preços neste site, portanto, não está claro quanta pesquisa pode ser feita gratuitamente.
346. Bixi
Os programas de compartilhamento de bicicletas Bixi são talvez alguns dos programas de compartilhamento de bicicletas mais conhecidos em algumas das maiores cidades da América do Norte. Curiosamente, a marca também divulga dados abertos que fornecem informações sobre coisas como histórico de viagens e status da estação, bem como comparações que podem ser feitas entre membros e usuários ocasionais. Os jornalistas locais que estão investigando como as pessoas estão usando e adaptando programas de compartilhamento de bicicletas em suas vidas têm todos os motivos para recorrer a esses dados.
347. Banco de dados de acidentes
De Amelia Earhart ao voo 8501 da AirAsia da Indonésia, acidentes de voo e avião são um tema que atrai a atenção das pessoas. O Banco de Dados de Acidentes arquiva e armazena dados sobre acidentes de aviação ocorridos entre os anos de 1920 e 2017. Os acidentes contabilizados neste banco de dados incluem acidentes com dirigíveis civis e militares, acidentes que envolveram a morte de celebridades ou de alguém famoso, acidentes de helicóptero com 10 ou mais mortes. , voos regulares e não regulares de passageiros que terminaram em morte.
Transport for London é o órgão governamental responsável por supervisionar o transporte público na área da Grande Londres. Existem mapas de metrô e trens disponíveis no site, juntamente com um guia de planejamento de viagem. Além de todos esses serviços práticos, o site também hospeda muitos dados abertos, incluindo ciclismo, qualidade do ar, banheira e até mesmo ostras. Qualquer pessoa interessada em ver como os residentes da Grande Londres utilizam os transportes públicos pode beneficiar do acesso a estes dados.
349. CMAP
O CMAP é responsável por fazer o planejamento e organização regional nos condados de DuPage, Lake, McHenry, Kendall, Kane, Cook e Will em Illinois. Como pode ser visto no website, as responsabilidades do CMAP estendem-se à abordagem de questões como desenvolvimento comunitário, impostos e indicadores económicos, e até mesmo estradas e trânsito. É por isso que os dados abertos relativos a áreas como indicadores regionais e viagens são úteis para um jornalista que tenta compreender o panorama geral no que diz respeito ao futuro da região.
350. Estrutura de análise de frete
Realizado graças a uma colaboração entre o Bureau of Transportation Statistics e a Federal Highway Administration, o Freight Analysis Framework coleta dados que são então usados para avaliar a saúde geral e o desempenho do sistema de frete. Este software coleta informações sobre detalhes como tipo de mercadoria e tonelagem em comparação com as estações de partida e chegada e esses dados, por sua vez, são disponibilizados para acesso e download do público, na íntegra ou em formato resumido.
351. Ciência Mozilla
Mozilla Science é um software colaborativo de código aberto e prática que existe para auxiliar no desenvolvimento e distribuição de diferentes fontes de dados e resultados de pesquisas. Deixando de lado os interesses de transparência, a decisão de abrir programas e colaborar no processo de refinamento torna mais fácil melhorar os programas já existentes. Com projetos disponíveis em diversas áreas, incluindo ciências da vida e medicina, entre outras, existem aqui soluções de software que podem representar um progresso digno de nota na área.
352. Conjuntos de dados interessantes
A atração quando se trata de Cool Datasets é facilmente aparente pelo nome do site. Nesta página, os conjuntos de dados se enquadram em seis categorias gerais: governo, entretenimento, ciência, envios de usuários, diversos e aprendizado de máquina. Os jornalistas que gostariam de explorar os dados e garimpar histórias são os que mais ganham ao verificar o que este site tem a oferecer. Existe uma opção para explorar os conjuntos de dados e, se possível, contribuir também com conjuntos de dados.
OpenDataMonitor é uma plataforma que pega conjuntos de dados públicos e os apresenta de uma forma mais intuitiva e fácil de ser seguida pelos indivíduos. Os pesquisadores podem acessar a plataforma para ver um resumo do que os recursos de dados abertos são capazes e poderão ver os dados existentes apresentados a eles de uma forma mais envolvente visualmente. O site explica sua metodologia e benchmarks, e os editores não deverão ter problemas para encontrar dados que valham a pena publicar.
354. Base Crunch
O CrunchBase é talvez mais conhecido por sua ênfase em estatísticas e por seu compromisso em fazer com que seus leitores tenham acesso aos melhores dados disponíveis. Indivíduos com mentalidade empresarial visitam este site todos os dias para aprender sobre as últimas tendências em investimentos e na indústria. Aqui, jornalistas e editores encontrarão notícias e discussões recentes sobre as últimas tendências de negócios. Enquanto isso, como parte de sua opção paga, o site também hospeda extensos conjuntos de dados que podem ser analisados usando as ferramentas de software do Crunchbase.
355. Índice
Index é uma plataforma com uma proposta de venda única porque tem algo a oferecer a todos, entre startups, investidores, analistas e corporações. O site também hospeda informações sobre mais de 100.000 empresas do setor de tecnologia, ao mesmo tempo que oferece aos usuários a capacidade de classificar, criar e exportar planilhas. Editores e jornalistas que folheiam as manchetes em busca de ângulos potenciais para histórias podem ficar à frente das notícias de negócios por meio deste site. O índice pode ser incomum, mas não há dúvida de que é um recurso útil.
356. SEMRUSH
SEMrush se orgulha de ser uma das ferramentas de inteligência de pesquisa mais bem estabelecidas disponíveis para profissionais de marketing online. Entre a academia e os webinars, os pesquisadores têm todas as oportunidades de aprender os fundamentos. No entanto, as seções do blog e de notícias contêm informações suficientes para que editores e jornalistas possam facilmente ficar por dentro das últimas notícias em publicidade online e SEO. Os serviços da SEMrush têm um preço, mas há muitas informações de qualidade que eles fornecem gratuitamente.
357. Ahrefs
Ahrefs talvez seja melhor resumido como um conjunto de ferramentas de marketing que são potencialmente úteis para qualquer pessoa que publica conteúdo online. O site oferece uma combinação de serviços como pesquisa de conteúdo, monitoramento da web, pesquisa de palavras-chave e pesquisa de backlinks para ajudar os usuários a fazer engenharia reversa do sucesso dos concorrentes. Provavelmente mais útil para editores online no grande esquema das coisas, o blog Ahrefs por si só representa um valor excelente para aqueles que gostam de seu marketing feito com base em dados.
358. Lista de Anjos
AngelList, com seu nome inteligentemente escolhido, é basicamente duas partes Craigslist e uma parte LinkedIn, com ênfase em reunir investidores, candidatos a emprego e startups em um só lugar. Juntamente com este conceito interessante de site, há muitas oportunidades para jornalistas empreendedores descobrirem as startups mais recentes e as mais recentes tendências de investimento antes que se tornem populares. Com sua interface simples e forte orientação comercial, este site é útil para profissionais em mais de um aspecto.
359. Adquirido
Em praticamente todos os setores, a aquisição de uma empresa pode mudar uma indústria inteira praticamente da noite para o dia. Acquired é um site que tem a função de manter o público informado quando for feita uma aquisição no setor de tecnologia. Cheios de estatísticas que podem ser visualizadas no site, além da capacidade de filtrar pesquisas, os jornalistas que escrevem sobre tecnologia têm a ganhar ao máximo ao tornar o Acquired uma parte regular de sua navegação diária na web.
360. Marca
Mattermark é um serviço pago que facilita a vida dos tomadores de decisão das empresas, produzindo listas de clientes de qualidade que levam em consideração tanto as empresas quanto seus principais funcionários. Fornecendo perfis de empresa abrangentes, flexibilidade com sua API e até mesmo recursos de exportação para fins de fazer atualizações, a Mattermark faz todos os esforços. As empresas que desejam direcionar melhor seu alcance e ao mesmo tempo acompanhar os resultados de suas campanhas têm a ganhar muito com a inscrição.
361. Fintechstartups
A FintechStartupsCo atua como uma espécie de agregador que acompanha quanto diferentes empresas conseguiram arrecadar em seus IPOs. Ostentando um design minimalista que alterna entre as guias “startups” e “notícias”, esta é uma maneira rápida e fácil para os jornalistas ficarem por dentro das últimas notícias sobre arrecadação de fundos. Enquanto isso, os editores que buscam conteúdo rápido e histórias rápidas também têm a ganhar ao dar uma nova olhada no que este site tem a oferecer.
362. DataFox
Caso o nome não revele tudo, DataFox é uma empresa que se esforça para fornecer a seus clientes empresariais as informações de que precisam para maximizar seus CRMs e, em geral, tomar decisões baseadas em dados. Oferecendo serviços que incluem conferência e inteligência da empresa, APIs e sinais da empresa, esta empresa é efetivamente um balcão único para empresas que estão renovando seu trabalho de vendas e divulgação. Editores digitais e provedores de conteúdo também podem querer dar uma olhada.
363. Envio aberto
OpenSpending é uma plataforma gratuita, que pode ser acessada praticamente em qualquer lugar do mundo, que permite aos usuários pesquisar e examinar dados financeiros de domínio público. Para membros da sociedade que não são hackers, esta é uma ferramenta poderosa para visualização e análise. Os jornalistas, em particular, podem usar o OpenSpending para encontrar novos insights interessantes e buscar ângulos de reportagem, conforme sugerido pela empresa diretamente em seu site. Como bónus adicional, os jornalistas estão entre as profissões especificamente solicitadas no fórum.
364. API de esportes ESPN
Não contente em ser apenas o canal de esportes mais popular na TV a cabo, a ESPN está expandindo sua influência em codificação e APIs. No Developer Center, o site oferece aos editores a escolha de diversas APIs que incluem notas de pesquisa, classificações avançadas, escolhas de rascunhos, calendários e manchetes. Existe até uma API que carrega perfis de atletas, biografias e estatísticas em todos os principais esportes. Jornalistas que se preparam para escrever uma matéria com conteúdo esportivo só podem se beneficiar navegando por eles.
365. Referência esportiva
Para os amantes de esportes que gostam de estatísticas e recursos avançados em um só lugar, o Sports Reference é um dos melhores sites da web. Com dados históricos que incluem estatísticas de times e jogadores sobre ataque e defesa, os pesquisadores esportivos podem ir tão amplo ou tão restrito quanto quiserem com este site. Além disso, existem números para praticamente todos os principais esportes, do basquete ao beisebol, e também dados separados para diferentes esportes universitários.
366. Conjunto de dados de um milhão de músicas
A apropriadamente chamada “Coleção de Milhões de Músicas” é responsável por 28 conjuntos de dados completos de metadados e informações sobre os recursos de áudio de exatamente um milhão de músicas. Em grande parte resultado do trabalho do LabROSA da Universidade de Columbia junto com o Echo Nest, essas informações estão acessíveis e hospedadas no sistema AWS da Amazon. Os usuários podem realizar pesquisas de informações por meio do Infochimps, o que as torna ainda mais acessíveis para jornalistas em busca de curiosidades obscuras, bem como para editores de conteúdo.