Hay muchos tipos diferentes de sitios que brindan una gran cantidad de datos gratuitos, gratuitos y de pago que pueden ayudar a los desarrolladores de audiencias y a los periodistas con sus esfuerzos para informar y contar historias. El equipo de State of Digital Publishing desea reconocerlos, como resultado de las búsquedas manuales. y el reconocimiento de nuestra audiencia actual.
1. Kaggle
Kaggle es un sitio que permite a los usuarios descubrir el aprendizaje automático mientras escriben y comparten código basado en la nube. Basándose principalmente en el entusiasmo de su considerable comunidad, el sitio organiza concursos de conjuntos de datos por premios en efectivo y, como resultado, tiene una gran cantidad de datos compilados en él. Ya sea que esté buscando datos históricos de la Bolsa de Valores de Nueva York, una descripción general de las tendencias de producción de dulces en los EE. UU. o código de vanguardia, este sitio está repleto de información.
2. Wikipedia
Es imposible estar en Internet por mucho tiempo sin encontrarse con un artículo de Wikipedia. Con artículos que van desde biografías históricas con fuentes completas y referencias hasta líneas de tiempo del futuro cercano y lejano, es seguro decir que Wikipedia ha consolidado su estatus como una enciclopedia libre basada en la web. Entre la entrada que sirve como descripción general del tema y los muchos libros y referencias en línea que ofrece el sitio, Wikipedia es el mejor amigo del escritor en muchos aspectos.
Como se puede deducir del nombre del sitio web, Common Crawl busca o "rastrea" la web en busca de datos que luego almacena y crea en un repositorio abierto al que pueden acceder los usuarios. Para dos ejemplos de lo que es posible con este sitio, los marcadores de patentes virtuales y las listas completas de sitios web que ofrecen fuentes RSS brindan una pequeña muestra de cuán poderosa es esta aplicación. Si hay comparaciones de datos o sitios que desea realizar, esta es una herramienta accesible para crear información original.
4. EDRM
EDRM, abreviatura de Electronic Discovery Reference Model, es un sitio para profesionales del derecho dedicado a aprovechar el potencial de e-discovery y las reglas y expectativas que rodean cómo se rige la información. Además, los miembros de EDRM trabajan juntos para desarrollar estándares colaborativos, software y herramientas educativas diseñadas para promover los objetivos de la comunidad. Para obtener información sobre las formas en que la tecnología puede y ha estado cambiando los aspectos procesales y administrativos de la práctica legal, este es el sitio que desea visitar.
Mahout se enfoca en una pieza de software del mismo nombre que intenta descubrir la logística de construir un entorno que sea capaz de crear aplicaciones de aprendizaje automático de alto rendimiento que se puedan escalar y crear rápidamente. Para los investigadores que desean compilar y manipular sus propios conjuntos de datos o probar aplicaciones de aprendizaje automático, este software es especialmente útil. Este sitio tendrá a las personas bien encaminadas hacia la competencia con este software.
El Proyecto Lemur es una base de datos que se enfoca en apoyar la investigación sobre la recuperación de información y el manejo de tecnologías del lenguaje humano. Con páginas web que suman aproximadamente mil millones y 10 idiomas recopiladas desde enero de 2009 hasta febrero de 2009, la gran cantidad de material presente y el apoyo lo convierten en un excelente recurso para los investigadores. Entre todo esto y el soporte adicional que se puede encontrar en el sitio, cualquier persona interesada en la tecnología y los lenguajes humanos tendrá mucho con lo que trabajar en este sitio.
Project Gutenberg es un directorio que presenta novelas, artículos y otros trabajos de dominio público. La colección de más de 54,000 libros electrónicos del sitio abarca desde materiales conocidos como Shakespeare, Mark Twain y Jane Austen hasta obras menos conocidas de nombres más oscuros como Henri Bergson y Samuel Butler. Ya sea tomando una novela clásica para leer bien o investigando cómo la gente experimentaba la vida en el siglo XIX, el Proyecto Gutenberg es un recurso excelente.
8. Millones de conjuntos de datos de canciones
Este es un sitio web que alberga un conjunto de datos completo que contiene las funciones de audio y los metadatos de aproximadamente 1 millón de canciones populares. Además del conjunto de datos principal de un millón de canciones, también hay conjuntos de datos numéricos que la comunidad ha contribuido en categorías relacionadas, como versiones de canciones, etiquetas de género y letras, entre otras. Los historiadores de la música, los aficionados o los investigadores que deseen esta información podrán ordenar los datos con relativa facilidad. Este puede muy bien ser el conjunto de datos más extenso sobre este tema en todo Internet.
9. Amazonas
Todo el mundo conoce a Amazon como un minorista digital, pero ¿sabía que Amazon también alberga conjuntos de datos públicos gratuitos a los que cualquiera puede acceder sin tener que almacenar ni descargar nada en sus propios dispositivos? Con datos que abarcan desde el clima, el entorno espacial y la información meteorológica hasta imágenes enfocadas en el desarrollo de algoritmos que ayudan en la visión por computadora, no hay escasez de opciones para aquellos que desean una forma más conveniente de analizar cantidades masivas de datos.
Con el fin de promover una mayor transparencia, lograr que más ciudadanos participen y fomentar el diálogo, el Gobierno de Canadá ofrece una gran cantidad de datos como parte de su iniciativa de Gobierno Abierto. En este sitio puede encontrar conjuntos de datos sobre temas relacionados con el gobierno, como los niveles de capacidad de los refugios para personas sin hogar en Canadá, así como números regionales sobre los niveles de participación de los anglófonos y francófonos en el sector público. Con acceso a conjuntos de datos de esta naturaleza, no hay necesidad de depender de las estadísticas de otras personas para encontrar información.
Data Catalogs, ahora Data Portals, ofrece a los usuarios un sitio conveniente para navegar por portales de datos abiertos de todo el mundo. Dado que los portales están siendo evaluados y seleccionados por varios niveles de gobiernos, varias ONG e incluso el Banco Mundial, los datos disponibles para el análisis son de muy alta calidad. Los usuarios tienen la opción de navegar o aportar datos a los portales. Desde el punto de vista de la investigación, la variedad de temas e información hace de este sitio un lugar especialmente conveniente para comenzar una búsqueda de información.
Data.gov.uk es un sitio que permite a las personas buscar y acceder a datos que publican varios organismos públicos, departamentos gubernamentales, autoridades locales y agencias gubernamentales. Aquí los investigadores pueden encontrar información sobre el clima económico para las pequeñas empresas, el comercio, las importaciones, la industria y las exportaciones, o incluso investigar los pagos de más de 25 000 libras esterlinas realizados por departamentos gubernamentales. Dado que el sitio establece explícitamente que los datos se pueden usar para la investigación, la información cubierta aquí puede incluso generar más ideas a medida que los investigadores la revisan.
Este sitio es donde el gobierno de los EE. UU. proporciona datos abiertos a los que el público puede tener acceso en forma de conjuntos de datos. Además de los datos sin procesar, el sitio también ofrece una serie de herramientas que se pueden usar para realizar visualizaciones de datos y crear aplicaciones para la web y dispositivos móviles. No cometer errores. Los datos son inmensos con información que va desde quejas de tarjetas de crédito hasta datos del programa federal de préstamos para estudiantes en más de 197,000 conjuntos de datos. Este sitio ofrece muchas oportunidades para la innovación y el análisis exhaustivo.
DataSF ofrece cientos de conjuntos de datos en relación con la ciudad y el condado de San Francisco. ¿Está interesado en ver qué han estado presionando los cabilderos locales y regionales? ¿Necesitas estadísticas sobre criminalidad? Explore la pestaña Showcase para ver lo que las personas han logrado con los datos o use el formulario para hacer una contribución. Hecho con datos abiertos y ofreciendo una academia, un blog y una serie de otras herramientas, este sitio está impulsado en gran parte por la colaboración y la comunidad. Esto lo convierte en un activo para el investigador.
15. DatosFerrett
DataFerrett se diferencia de muchos sitios en que no es un repositorio o directorio sino una herramienta que permite a los usuarios personalizar datos de fuentes locales, estatales y federales a través del análisis y la extracción de datos. Esta herramienta permite a los usuarios crear hojas de cálculo completas y personalizadas y luego convertir la misma información en un mapa o gráfico sin tener que descargar o habilitar ningún otro software. Organizar entradas masivas de datos y convertirlos en algo que sea fácil de leer nunca ha sido tan fácil.
16. inforum
A través de la Universidad de Maryland, Inforum pone a disposición del público los datos económicos de los Estados Unidos. Muchas agencias del gobierno de EE. UU. han contribuido a este sitio hasta el punto de que ahora contiene miles de "series temporales económicas", como las llama, y estas contienen números sobre producción industrial, índices de precios, estadísticas laborales e indicadores comerciales. Los datos están disponibles gratuitamente y se puede acceder a ellos con una computadora portátil o de escritorio personal. Los investigadores que desean obtener una buena visión de los datos económicos sin procesar tienen un recurso en Inforum.
17. europeaa
Según las propias cifras del sitio, las colecciones de Europeana suman un total de más de 50 millones de registros. Con los conjuntos de datos seleccionados aquí, los investigadores pueden encontrar la información que buscan en menos tiempo. Los conjuntos de datos aquí incluyen categorías como modelos 3D, mapas italianos de la Primera Guerra Mundial e incluso una colección de más de 20,000 fotografías históricas de museos lituanos, entre otros. Ya sea para búsquedas históricas generales o como punto de partida para revisar los registros masivos de Europeana, este es un recurso excelente.
Además de su cobertura ininterrumpida de noticias y eventos de última hora, The Guardian también tiene una sección completa dedicada a los anuncios publicitarios de datos. Las piezas aquí van desde temas serios como la efectividad de las políticas de vivienda para personas sin hogar hasta temas un poco más alegres como qué países tienen la mayor cantidad de ganadores del premio Nobel. A los periodistas e investigadores no les falta información para usar en sus propios proyectos desde este sitio. Con la ayuda de una búsqueda rápida, es posible encontrar datos sobre casi cualquier cosa.
19. Ómnibus de expresión génica
Organizado por el Centro Nacional de Información Biotecnológica, Gene Expression Omnibus es un sitio que contiene "datos públicos de genómica funcional" que cumple con los estándares MIAME (Información mínima sobre un experimento de micromatrices). El sitio también acepta datos ordenados o secuenciados mientras proporciona las herramientas necesarias para encontrar y descargar la información. Aquellos interesados en estudiar genomas o adquirir información sobre el tema tendrán todos los datos que necesitan aquí y algo más.
Reconocido durante mucho tiempo por sus contribuciones a la innovación y el progreso en los campos de las ciencias sociales, el Centro para la ciencia de datos espaciales (CSDS) de la Universidad de Chicago explora la próxima frontera con su incursión en el análisis espacial y la tecnología. El trabajo de la CSDS tiene aplicaciones en prácticamente cualquier campo que tenga que lidiar con el espacio al abordar los problemas. En consecuencia, campos como la economía ambiental, la salud pública y la criminología se han beneficiado de estas aplicaciones. La dedicación de CSDS al software de código abierto y la distribución de su información hacen que los datos sean aún más accesibles.
21. Konect
A través del uso de datos recopilados por el Instituto de Ciencias y Tecnologías Web de la Universidad de Koblenz-Landau, KONECT (Colección de redes de Koblenz) ofrece investigaciones realizadas en el campo de la ciencia de redes y sus temas relacionados. El proyecto utiliza una serie de sus propias herramientas de análisis de red de software para procesar números y producir diagramas y algoritmos dibujados. KONECT luego aloja los resultados de su trabajo analítico directamente en el sitio web. Con más de 200 conjuntos de datos para elegir, este es un recurso que vale la pena explorar.
MIdata es un sitio que actúa como depósito de datos que se supone que deben utilizar los datos de aprendizaje automático. Estos conjuntos de datos pueden abarcar desde una compilación de expresiones faciales humanas hasta temas más científicos, como predecir cómo se unirán las moléculas. Con entradas divididas en categorías que ofrecen acceso a datos sin procesar, tutoriales en la sección de materiales y métodos, así como tareas y desafíos de aprendizaje, este sitio permite a los investigadores analizar el repositorio en busca de conjuntos de datos que sean de su interés.
23. NASDAQ
El NASDAQ es una bolsa de valores de fama mundial que durante mucho tiempo ha sido un excelente recurso para periodistas e investigadores en busca de datos del mundo de las finanzas y los negocios. Aquí encontrará información sobre OPI, datos de precios históricos y las últimas noticias financieras que hacen de este sitio un destino en línea para obtener datos financieros. NASDAQ Composite también ofrece opciones de datos pagados para aquellos que deseen hacer un análisis más profundo. Este es un recurso muy respetado y bien establecido.
24. NASA
Desde el alunizaje, ahora todo el mundo ha oído hablar de esta agencia gubernamental y sus incursiones en el espacio exterior. De interés para los periodistas, sin embargo, es cómo la NASA también es una fuente valiosa de datos a través de su Archivo Coordinado de Datos de Ciencias Espaciales. Aquí, los investigadores pueden encontrar datos de misiones de ciencia espacial en categorías como astrofísica, recursos de imágenes y heliofísica, entre otras. Además, también hay numerosos libros blancos disponibles en el sitio para acompañar los nuevos datos que se envían.
Socrata es un sitio que toma los datos del gobierno que están disponibles y los pone en un formato que hace que sea más fácil para las personas analizar, hacer clic y encontrar la información que están buscando. Diseñado específicamente teniendo en cuenta las necesidades de personas no técnicas, como expertos en políticas públicas, investigadores, empresarios y ciudadanos preocupados, Socrata utiliza la nube para recopilar datos de una variedad de fuentes. Para los periodistas que intentan comprender la efectividad de las diferentes políticas, esta es una plataforma útil.
26. Quandl
Quandle es un sitio que ofrece principalmente datos económicos y financieros formateados teniendo en cuenta las necesidades de los profesionales de la inversión. Basándose en más de 500 fuentes de información de organizaciones confiables como CLS Group, la ONU, los bancos centrales y Zacks, entre otros, para agregar sus datos, esta fuente de datos es perfecta para investigadores y periodistas que desean obtener una visión general de un vistazo. Gracias al complemento de Excel del sitio, acceder a los datos directamente nunca ha sido tan fácil para los usuarios.
27. Universidad de Carnegie mellon
Carnegie Mellon University tiene una reputación bien merecida como una excelente institución académica. Lo que mucha gente no sabe es que StatLab de Carnegie Mellon es un recurso útil para los periodistas en busca de datos. Este archivo de conjunto de datos incluye datos sobre temas como los salarios de la MLB de los jugadores norteamericanos en 1986, así como datos diseñados para evaluar la precisión del software de estadísticas. A cambio del reconocimiento, estos conjuntos de datos están disponibles para uso público.
28. UCI
El repositorio de aprendizaje automático de UC Irvine, conocido como UCI, es un sitio que almacena una tonelada de datos interesantes que los periodistas pueden usar. Hogar de 394 conjuntos de datos a partir de este escrito, el sitio tiene la ventaja adicional de tener una interfaz que es fácil de buscar. Algunos de los conjuntos de datos más populares incluyen información sobre "Reconocimiento de actividad humana mediante teléfonos inteligentes", vino y marketing bancario, entre otros temas. A cambio de usar todos estos datos, el sitio simplemente solicita una cita.
29. UCR
Si usted es un periodista que está investigando el desarrollo del aprendizaje automático, entonces la página de clasificación/agrupación de series temporales de UCR será una excelente lectura. El sitio proporciona un documento informativo útil que le proporcionará toda la información básica que necesita saber. Junto con una descripción general de lo que contiene la información, el sitio también ofrece la posibilidad de descargar los datos directamente. Solo recuerde usar el formato de cita que solicita el sitio si usa estos conjuntos de datos.
30. Censo de EE. UU.
¿Necesita estadísticas sobre la riqueza de la población? ¿Quiere saber el desglose exacto por género de un campo en particular? El censo de EE. UU. es un sitio que tiene todos estos datos y más disponibles para el público. Ordene los datos por año o región, y podrá encontrar rápidamente las estadísticas que la mayoría de la gente ni siquiera sabía que se incluyeron en el censo de EE. UU. de la forma en que lo fueron. Estos números estaban disponibles en Excel y Microsoft Word como opciones que hacen que los datos sean aún más accesibles para los periodistas.
31. Wolfram Alpha
Wolfram Alpha es en realidad un motor computacional que permite a los usuarios ingresar los datos que desean conocer y recibir un cálculo. El motor realiza análisis y datos estadísticos, química, fechas y horas, e incluso palabras y lingüística, entre otras cosas. Para los usuarios que intentan descubrir nuevas formas de manejar datos, esto es especialmente útil debido a que es capaz de generar nuevos cálculos con solo presionar un botón. Los periodistas en particular pueden ganar mucho al usar esto como un recurso complementario.
32. Gañido
Resulta que Yelp es más que solo restaurantes y reseñas comerciales de usuarios. Este sitio de revisión dirigido por el usuario también mantiene un conjunto de datos que brinda a los investigadores acceso a revisiones, datos de usuarios y negocios para "fines personales, educativos y académicos". Según el conteo de la compañía, eso es 4.7 millones de reseñas y 156,000 negocios en 12 áreas metropolitanas incluidas en el conjunto de datos. Con esos números, los materiales y las tendencias que los investigadores podrían descubrir en estos datos podrían ser una sorpresa agradable.
33. Mundo de datos
¿Quieres tener una lista de las páginas de Facebook eliminadas? ¿Qué te parece poder clasificar los datos económicos de EE. UU. por condado? Data World es un sitio que permite a las personas compartir, hospedar, colaborar y realizar un seguimiento de los datos. El sitio incluso incluye una sección para periodistas que describe las razones por las que Data World es útil para los miembros de la profesión y al mismo tiempo señala las capacidades de alojamiento de un predictor FOIA simplificado, así como páginas diseñadas para ayudar con la organización. En general, esta es una combinación sólida de datos y alojamiento de datos.
34. El libro de hechos mundiales
Dirigido y operado por la CIA, World Factbook le brinda información sobre las estructuras sociales, la historia, las situaciones militares y económicas de 267 países junto con mapas, banderas y un conjunto de zonas horarias siguiendo los materiales en el mapa mundial. El sitio ofrece una visión completa y profunda del tema de una manera que va más allá de lo básico. En resumen, esta es una fuente de datos que debería estar en el arsenal de todo periodista.
35. HealthData.gov
Administrado por el Departamento de Salud y Servicios Humanos de EE. UU., HealthData.gov ofrece al público acceso a "datos de salud de alto valor" con la esperanza de captar la atención de empresarios, legisladores e investigadores. Al menos en las áreas de desarrollo de productos y servicios, las personas han podido examinar estos datos y obtener resultados. Los periodistas que desean estar a la vanguardia de los datos de salud o que están investigando una declaración que ha publicado un funcionario de atención médica pueden usar este sitio para encontrar respuestas.
36. UNICEF
Este es un sitio que otorga credibilidad instantánea a los periodistas que utilizan la información que ofrece. Las estadísticas que cubre UNICEF incluyen aquellas relacionadas con temas de salud y derechos humanos como la educación, la salud materna, la pobreza infantil, el agua y el saneamiento y la discapacidad infantil, entre muchas otras categorías de estadísticas que se mantienen. Es útil para los investigadores porque está actualizado y respaldado por una de las organizaciones más conocidas del planeta. Los periodistas no pueden equivocarse al citar esta fuente de datos.
37. Organización Mundial de la Salud
La Organización Mundial de la Salud es una organización internacional que recopila estadísticas e información de salud en todo el mundo. Además de la información que se puede encontrar directamente en la página de inicio, el sitio también ofrece datos a través del Observatorio de Salud Global. Estos datos incluyen información sobre los pasos que están tomando los países hacia la atención médica universal, la investigación y el desarrollo en salud, entre otras categorías. Los periodistas encontrarán aquí mucha información sobre brotes, emergencias sanitarias y cobertura sanitaria desde una perspectiva internacional.
Con la disponibilidad de Google Public Data, los periodistas claramente pueden confiar en Google en más de un sentido. El gigante del motor de búsqueda tiene datos públicos disponibles y disponibles para analizar con más de 100 conjuntos de datos públicos a su nombre. El tema de los datos va desde lo extremadamente serio con los Indicadores de Desarrollo Mundial y los Indicadores de Desarrollo Humano hasta lo interesante con datos sobre las carreteras más peligrosas de Europa. Todo lo que un investigador tiene que hacer es realizar una búsqueda y ver qué datos públicos tiene Google.
Gap Minder ofrece datos sobre una serie de indicadores locales y nacionales junto con enlaces e información sobre todos los proveedores de datos. Usando este sitio, los investigadores pueden ver información como la edad de las mujeres cuando se casan por primera vez, estadísticas sobre el consumo de alcohol y las causas de muerte en los niños. Para los periodistas que escriben con un sesgo internacional o que elaboran datos comparativos, este es un excelente recurso. Esta es una fuente útil de datos independientemente.
Google Trends es una herramienta que brinda a los investigadores información sobre lo que la gente está buscando en este momento. Los investigadores pueden comparar los datos con las tendencias que ocurrieron en el pasado y también pueden usar la herramienta para hacer estimaciones anticipadas, por ejemplo, la temporada navideña, para ver qué sucederá con las búsquedas en el futuro. Las tendencias de Google ofrecen gráficos, temas candentes y muchas oportunidades para descubrir las noticias antes de que sean noticias oficiales.
Google Finance ofrece una oportunidad rápida y fácil de realizar una búsqueda más profunda de una empresa que los inversionistas han estado entusiasmando. Formas sencillas de filtrar indicadores técnicos y revisar las últimas noticias sobre la empresa en una ventana simple y directa que le permite ordenar la información aún más. Además, es gratis. Para los periodistas que quieran investigar las finanzas de una empresa que cotiza en bolsa, Google Finance ofrece una interfaz intuitiva para acceder a esta información. Desafortunadamente, Google ha descontinuado recientemente algunas de las funciones principales, como la cartera de finanzas. Aquí tienes algunas alternativas a Google Finance .
42. DBpedia
Cualquiera que alguna vez haya deseado una forma más fácil de realizar búsquedas en Wikipedia tiene motivos para estar entusiasmado con DBpedia. Impulsado por el compromiso de la comunidad, este sitio busca hacer posible realizar búsquedas más sofisticadas contra el contenido de Wikipedia. Con la versión en inglés que cuenta con 4,58 millones de entradas con clasificaciones y categorías asociadas, el sitio está en camino de ofrecer una cobertura completa basada en la información de Wikipedia. Los periodistas no pueden equivocarse con esta fuente de datos.
Para muchos, Pew Research está en el escalón superior en lo que respecta a encuestas, informes y datos de investigación. El sitio cubre temas que van desde opiniones políticas hasta tendencias sociales y desarrollos en varias industrias laborales. Pew Research también tiene una función de búsqueda que facilita más que nunca el acceso a la información. Los periodistas que desean estadísticas y hallazgos actualizados que provengan de una fuente confiable y respetable no pueden equivocarse si recurren a Pew Research.
44. instituto amplio
Para los periodistas que desean conocer las últimas noticias en relación con el cáncer, los conjuntos de datos de Broad Institute podrían ser el lugar perfecto para encontrar la información. Esto también incluye información sobre temas adicionales como bioinformática y biología computacional, así como cáncer cerebral y descubrimiento de patrones moleculares. En resumen, este sitio brinda a los periodistas una ventaja en términos de encontrar datos detallados sobre el cáncer para crear historias a partir de los datos proporcionados por Broad Institute.
45. datos ONU
UNdata ofrece información sobre diferentes países del mundo. Esto incluye datos como indicadores técnicos, indicadores sociales e indicadores económicos para cada país involucrado. Para los periodistas que están trabajando en historias de interés humano o historias que podrían beneficiarse de ser corroboradas por algunas estadísticas y datos adicionales, UNdata es la opción ideal. La precisión de los datos, así como la reputación de la ONU, hacen de esta una fuente de datos con la que los periodistas pueden contar mientras investigan.
46. Google Académico
Imagínese si en lugar de desplazarse por los sitios web, fuera posible realizar una búsqueda que no tuviera nada más que artículos revisados por pares y materiales académicos. Google Scholar hace posible que las personas encuentren artículos de revistas, libros blancos y publicaciones de los principales académicos del mundo. Como suele ser el caso de esta empresa, Google Scholar es tan intuitivo como es posible, ya que el usuario simplemente debe ingresar una palabra clave para comenzar. La búsqueda de trabajos académicos nunca ha sido tan sencilla.
47. Reddit
Conocido más comúnmente como "la portada de Internet", Reddit es uno de los sitios web más populares de Internet. Además de ser un indicador preciso de lo que sucede en línea, el sitio también tiene un subreddit, o un subforo, que también está dedicado a los conjuntos de datos. Los usuarios pueden solicitar conjuntos de datos, publicar recursos y tener discusiones sobre cómo trabajar con datos a través de formatos como JSON. Los investigadores ganan mucho al leer detenidamente esta fuente de datos.
48. mercado de datos
Qlik DataMarket le permite recopilar y manejar datos de fuentes externas. Esta plataforma permite a los usuarios tomar prestados varios conjuntos de datos con la opción de hacer una referencia cruzada con los datos que ya poseen para refinar su sentido de contexto más amplio. Mejor aún, aunque esta es una plataforma paga según el tema, también hay una opción gratuita con Qlik Datamarket. Los periodistas que exploran los datos pueden hacerlo a su antojo.
49. hubspot
Hubspot siempre ha sido un líder de pensamiento en quién es quién en marketing para empresas. Desde el punto de vista de la investigación, este es un sitio que informará a los investigadores sobre lo que sucede en la industria, así como sobre lo que la gente de la industria del marketing está hablando en este momento en tiempo real. Los periodistas pueden usar este sitio para obtener más información sobre las tendencias. En ese sentido, Hubspot es un gran recurso para los investigadores.
50. Oficina de Estadísticas de Justicia
Tal vez como era de esperar, la Oficina de Justicia mantiene un montón de estadísticas. En el sitio web de la Oficina puede encontrar números sobre arrestos, muertes de reclusos, ejecución por pena capital, estadísticas de aplicación de la ley y censos de las cárceles. El sistema de justicia penal es un tema de constante fascinación tanto para el público como para las personas involucradas en él. Eso es lo que hace que las estadísticas de la Oficina de Justicia sean aún más útiles para los periodistas que investigan el sistema de justicia penal.
51. Reporte Uniforme de Crimen
El Uniform Crime Report es una recopilación de estadísticas sobre delitos contra la propiedad y delitos violentos recopilada por el FBI. Si bien las agencias de aplicación de la ley de todo EE. UU. han estado informando estos datos desde 1930, los hallazgos se han publicado desde 1958 y pueden buscar en . Los periodistas que deseen explorar los datos sobre delitos tienen la opción de acceder y utilizar la herramienta de datos de la UCR para explorar la información disponible en este sitio.
52. Reporte Uniforme de Delitos
Uniform Crime Reporting es el resultado de un programa ideado por la Asociación Internacional de Jefes de Policía en 1929. Las cifras recopiladas por el FBI aquí se publican cuatro veces al año. Además de la información proporcionada por el programa de la UCR, el sitio también incluye informes sobre estadísticas de delitos de odio, agentes del orden asesinados y agredidos (LEOKA), así como los resultados y números proporcionados por el Sistema Nacional de Informes Basados en Incidentes.
53. NACJD
NACJD, o el Archivo Nacional de Datos de Justicia Penal, es un sitio que extrae información de conjuntos de datos como los Informes Uniformes de Delitos (UCR) y la Encuesta Nacional de Victimización por Delitos (NCVS) y luego almacena y distribuye las estadísticas. Diseñados para ser curados, almacenados y mantenidos para máxima accesibilidad, los datos vienen en varias formas, incluyendo experimentales, cualitativas y longitudinales. En última instancia, esto ofrece a los periodistas y otros investigadores otra forma de visualizar y acceder a las estadísticas de justicia penal.
First Databank es un sitio que se ocupa de datos sobre drogas. El sitio busca promover una toma de decisiones más eficiente y más basada en datos en el área de productos farmacéuticos. Esto permite que los médicos y clínicos comiencen a pensar en los medicamentos farmacéuticos de manera diferente mediante el uso innovador de la tecnología de First Databank. Desde un punto de vista profesional, este sitio es especialmente útil porque sus datos pueden ayudar a los equipos a adaptarse a medida que llega nueva información. Como mínimo, este es un recurso útil para los periodistas que escriben en el espacio farmacéutico.
55. FDA
La FDA, conocida como Administración de Alimentos y Medicamentos, es la agencia responsable de proteger la salud pública a través de la supervisión y aprobación de medicamentos, productos alimenticios, suplementos, vacunas y cosméticos, entre otros productos de consumo. Como recurso, la FDA tiene conjuntos de datos disponibles para que el público los examine al tiempo que proporciona datos técnicos para las personas que se sienten cómodas trabajando con hojas de cálculo y analizando la información que proviene de los conjuntos de datos. Este es definitivamente un recurso útil para los periodistas.
¿Alguna vez se preguntó cuánto paga exactamente el país a raíz de una epidemia de drogas? ¿Hay rumores de personas que consumen drogas de manera diferente que antes? Drugbase ofrece una base de datos repleta de estadísticas sobre las tendencias y el uso de drogas en los Estados Unidos. Hay infografías y publicaciones sobre temas como la comorbilidad de la adicción y la enfermedad mental o datos sobre la conducción bajo los efectos de las drogas (no ebrios). Este es un recurso que proporciona suficiente información para detectar tendencias y hacer comparaciones con datos anteriores.
57. UNODC
La UNODC, u Oficina de las Naciones Unidas contra la Droga y el Delito, tiene un sitio web dedicado a la promoción de su objetivo de ayudar a los estados miembros a adoptar estándares más estrictos de investigación, recopilación de datos y análisis forense. En este sitio, los investigadores pueden encontrar numerosas estadísticas y publicaciones que cubren temas como la recopilación de datos, el análisis de tendencias y los programas de investigación cuando sea posible. Un recurso que está lleno de información sobre una variedad de temas relacionados con la ciencia forense, así como la ciencia del tema.
58. Datos de la guerra contra las drogas
Drug War Facts es un sitio que ofrece una amplia discusión sobre la guerra contra las drogas, así como las consecuencias de la política. Esto incluye estadísticas y números sobre detalles como comparaciones entre el costo del tratamiento en comparación con el costo de depender de la aplicación de la ley, números sobre estimaciones de gastos de control de drogas y una gran cantidad de información sobre casi todos los temas relacionados con la guerra contra las drogas. Para muchas personas, este es el sitio más completo en la web con respecto a la guerra contra las drogas.
59. Centro Nacional de Estadísticas Educativas
El Centro Nacional de Estadísticas Educativas, a menudo denominado NCES para abreviar, es el lugar al que acudir para obtener todas y cada una de las estadísticas relacionadas con la educación. Este sitio tiene estadísticas sobre el estado de los préstamos para estudiantes, proyecciones de tendencias educativas, junto con conjuntos de datos y herramientas de comparación que se pueden usar para realizar un análisis más profundo. Los periodistas pueden usar este recurso para descubrir tendencias, verificar declaraciones públicas, revisar las publicaciones del Centro Nacional de Estadísticas Educativas y encontrar nuevas historias en los datos.
60. Banco Mundial
El Banco Mundial alberga numerosas estadísticas y datos compilados por el Grupo de Datos de Desarrollo en el sector financiero, así como la macroeconomía. Es posible ordenar los datos usando hashtags. Los usuarios pueden elegir entre una variedad de indicadores y hacer una selección por país para revisar las diferentes medidas del progreso del desarrollo. Como tal, este es un recurso al que cualquier persona que busque en el estado financiero y/o económico de los países miembros puede beneficiarse al tener acceso.
61. Oficina de estadísticas laborales
La Oficina de Estadísticas Laborales es la fuente de referencia de los periodistas para obtener números y estadísticas relacionados con las condiciones laborales actuales, lo que está sucediendo en el mercado laboral y cómo los precios cambian y afectan la economía de EE. UU. Dado que el trabajo estadístico de la agencia se remonta a 1884, no hay escasez de datos económicos para que los investigadores los examinen. El sitio almacena la información en una interfaz fácil de usar y actualiza constantemente los datos que están disponibles para la búsqueda. Esta es una fuente de datos que vale la pena explorar.
62. Los números
Los lanzamientos de gran éxito reciben mucha atención de los medios, pero es difícil saber qué tan bien le ha ido a una empresa sin números. Introduzca "Los Números". Este sitio web ofrece investigaciones y datos para la industria del cine y el entretenimiento. Los investigadores pueden explorar estimaciones de ingresos, expectativas de próximos lanzamientos y otros datos de inversión a través de la capacidad del motor de búsqueda basado en SQL de OpusData. The Numbers es el primer lugar que los investigadores deben visitar para obtener estadísticas confiables sobre películas y películas. Eso es lo que lo convierte en un excelente recurso.
Film Forever es un sitio que los investigadores pueden visitar para obtener inteligencia de mercado y datos de la industria cinematográfica en el Reino Unido. Aquí los usuarios pueden encontrar números de taquilla semanales de los 15 estrenos más importantes del Reino Unido, investigación de audiencia, informes, estudios de casos y el anuario estadístico principal de la organización. Además, el sitio también tiene un calendario que mantiene informados a los espectadores sobre cuándo se publicarán las próximas estadísticas. El nicho de Film Forever lo convierte en una fuente de datos particularmente valiosa.
64. IFPI
IFPI es un sitio que se enorgullece de tener un dedo en el pulso de la industria discográfica mundial. Los usuarios encontrarán informes publicados llenos de información sobre música grabada, datos de ventas nacionales y mundiales, así como informes sobre el lado comercial de la industria de la música que muestran cómo las empresas están invirtiendo en música. Estos informes permiten a los usuarios ver lo que está sucediendo. Este sitio mantendrá a los investigadores actualizados sobre lo que sucede en la industria de la música en tiempo real.
65. estatista
Statista es un motor de búsqueda como Google, solo que en lugar de páginas web, el sitio devuelve datos y estadísticas. Con solo presionar un botón, los usuarios pueden obtener acceso inmediato a más de un millón de estadísticas y datos. Los usuarios encontrarán infografías, estadísticas sobre China, la industria alimentaria, los mercados de consumo y, por una tarifa, los informes de la industria y los expedientes también están disponibles para su visualización. Ya sea que busque información sobre economía, redes sociales o Big Mac, este es el lugar para hacerlo.
66. EPA
La EPA, que es la abreviatura de la Agencia de Protección Ambiental de los Estados Unidos, es la agencia gubernamental responsable de proteger a las personas y el medio ambiente al hacer cumplir las leyes establecidas y aprobadas por el Congreso. En el sitio web de la EPA, los usuarios pueden consultar una serie de conjuntos de datos sobre temas que van desde la agricultura hasta temas tan específicos como las publicaciones anuales sobre productos químicos tóxicos y métodos de gestión de desechos. Este sitio es una excelente opción para los periodistas que desean acceder a datos ambientales sin procesar.
67. Centros para el Control y la Prevención de Enfermedades
Este sitio web de los Centros para el Control y la Prevención de Enfermedades se anuncia a sí mismo como una "ventanilla única para datos de salud pública ambiental". En este sitio, los investigadores encontrarán referencias y listas de sistemas de datos que reciben fondos nacionales mientras rastrean y almacenan información relacionada con preocupaciones de salud pública ambiental. Con un enfoque en programas que operan a nivel nacional y accesibilidad a través de capacidades de descarga directa, este es un recurso con el que se puede contar para obtener la información más reciente y precisa en la web.
68. Centros Nacionales de Salud Ambiental
Establecidos después de la fusión de tres agencias anteriormente independientes, los Centros Nacionales para la Salud Ambiental son el lugar ideal para obtener información de alta calidad sobre el medio ambiente. Ofreciendo datos completos que van desde datos oceánicos hasta registros de hielo de hace millones de años, si el problema involucra el medio ambiente, es probable que este sitio web tenga información al respecto. El compromiso de la agencia con la precisión y la excelencia en la administración de uno de los archivos más grandes de su tipo también la convierte en uno de los pocos sitios en línea que posee, actualiza y mantiene este tipo de datos.
69. Servicio Meteorológico Nacional
El Servicio Meteorológico Nacional de la Administración Nacional Oceánica y Atmosférica les dirá a los investigadores todo lo que necesitan saber sobre el clima. Este sitio ofrece búsquedas de datos que incluyen información sobre categorías como advertencias y pronósticos, clima, pronósticos geográficos y más. Además, viene con un mapa intuitivo y fácil de seguir con pestañas en las que se puede hacer clic para obtener diferentes resultados. Ya sea revisando lo que sucedió localmente o buscando el pronóstico para una ciudad en un estado diferente, este sitio descubrirá información rápidamente.
70. Maravilloso
Wunderground es un recurso que se dedica a garantizar que la información sobre el clima esté disponible para todos en todo el mundo y también se presta atención a las áreas que no reciben mucha cobertura. Wunderground declara explícitamente que ha tomado medidas para garantizar que la experiencia del usuario sea excelente en múltiples plataformas digitales. Esto significa que se puede acceder al sitio tanto a través de dispositivos móviles como de PC, lo que lo convierte en un recurso ideal para los periodistas que están en movimiento.
Weatherbase proporciona información sobre las condiciones actuales, promedios, información climática y condiciones de viaje de más de 40 000 ciudades de todo el mundo con la ayuda de una barra de búsqueda simple. Use el sitio complementario al que se vincula el sitio para encontrar información adicional sobre viajes al ritmo de convertidores de divisas, coordenadas e información del condado, entre otros datos divertidos. Weatherbase también se puede usar para encontrar lugares para vacacionar simplemente en función del clima. ¡Feliz búsqueda!
72. Atlas Energético
Publicado por la Agencia Internacional de Energía, el Energy Atlas presenta a los investigadores la capacidad de ver el mundo a través de las estadísticas de energía. Originalmente diseñado para ser una fuente de datos complementaria desde la fecha de su creación original, el sitio cuenta con un balance de energía de flujo animado de Sankey, así como varias bases de datos para acompañar las publicaciones que se pueden consultar en la página de estadísticas de la Agencia Internacional de Energía. Los investigadores encontrarán que este sitio y sus sitios complementarios son extremadamente útiles mientras investigan las formas en que los países y las ciudades usan la energía.
73. Oficina de Análisis Económico
La Oficina de Análisis Económico, o BEA para abreviar, publica una amplia gama de información útil que permite a los investigadores mantener sus dedos proverbiales en el pulso de la economía de la nación. En este sitio, hay números sobre las cuentas económicas de los EE. UU. que incluyen números sobre el gasto del consumidor, el PIB y los activos fijos, entre otros datos útiles. Los investigadores pueden buscar por región o industria, así como por nivel con opciones de búsqueda internacionales, nacionales y regionales. Pruebe la página de datos interactivos para obtener más información sobre la oficina.
74. Oficina Nacional de Investigación Económica
El sitio web de la Oficina Nacional de Investigación Económica, o NBER, es una fuente de datos que aborda la economía desde un punto de vista analítico. Alberga datos sobre una amplia gama de temas económicos con entradas tales como el Índice de Gobernanza Africana, el Ciclo Económico Oficial, los Índices Experimentales Coincidentes, de Adelantamiento y de Recesión, y la Base de Datos de Historia Macro. NBER tiene conjuntos de datos oficiales publicados y compilados bajo su propio nombre, así como índices compilados por otros editores.
75. Comisión de Valores de EE.UU
La Comisión de Bolsa y Valores de los Estados Unidos es una agencia que actúa como una especie de organismo de control para promover la transparencia, la equidad y la eficiencia en los mercados. Curiosamente, el sitio tiene un conjunto de datos de estados financieros que data de enero de 2009 a octubre de 2017 con actualizaciones cada trimestre. Los investigadores pueden confiar en este sitio para estar al tanto de las últimas noticias relacionadas con las presentaciones y la información que puede brindarle sobre las empresas y el estado de sus finanzas.
76. FMI
El Fondo Monetario Internacional, también conocido como FMI, es una organización bien establecida en el sector económico y financiero internacional. En el sitio web, los investigadores pueden encontrar una gran cantidad de datos sobre esos temas. Los usuarios pueden buscar conjuntos de datos por indicador y país y navegar por los gráficos y mapas mientras investigan. Los conjuntos de datos populares incluyen la dirección del comercio, los precios de los productos básicos, los indicadores de solidez financiera, las encuestas y las estadísticas de finanzas internacionales, entre otros elementos de información valiosa.
77. El Atlas-Harvard
Originalmente concebido por Harvard, el Atlas es una herramienta en línea que permite a las personas visualizar e interactuar con la situación comercial de una empresa. Atlas luego tomará la información y propondrá diferentes productos que el país podría fabricar potencialmente para mejorar su economía. Esta es una herramienta utilizada por legisladores, empresarios, inversionistas y miembros del público comprometidos que desean tener una mejor comprensión del clima económico de un país determinado. Las cuestiones de comercio y economías nacionales nunca han sido más accesibles.
Doing Business es el resultado de un esfuerzo por hacer evaluaciones objetivas de las regulaciones empresariales. El sitio examina casi 200 economías y numerosas ciudades midiendo detalles como indicadores económicos y clasificando la facilidad para hacer negocios. Este sitio permite a los usuarios examinar los efectos de varios tipos de regulaciones comerciales entre países y alberga informes, así como extensos datos cualitativos. Además, el sitio también permite realizar comparaciones en el tiempo.
79. camarada
Originalmente un proyecto del Departamento de Negocios, Energía y Estrategia Industrial del Reino Unido en conjunto con el Departamento de Comercio Internacional, Comtrade es un excelente recurso. Al tomar prestados datos de Comtrade Data de las Naciones Unidas, el sitio proporciona a los usuarios un gráfico interactivo que se puede utilizar para buscar, comparar y analizar las cifras exactas del comercio y los bienes entre países. Simplemente seleccione el país informante, elija un país asociado y haga las selecciones tanto como sea posible.
80. Datos financieros globales
Global Financial Data es una fuente que no solo compila datos financieros estándar, sino que toma información financiera que data desde el siglo XIII hasta la actualidad. Esta información se deriva de una variedad de fuentes, incluidos libros, materiales archivados, revistas académicas y periódicos de noticias. Además, el sitio tiene conjuntos de datos que utilizan el método estadístico de enlace de cadena. El resultado final, desde la perspectiva del usuario, es un recurso único en Internet en virtud de sus datos exclusivos.
Visualizing Economics es menos un recurso en el sentido de descubrimiento de datos del término y es más un servicio que se enfoca en diseñar gráficos de información y tableros interactivos. Además, Visualizing Economics también realiza análisis y diseño con el propósito expreso de facilitar la comprensión de los datos económicos. A través de este sitio, los periodistas tienen una oportunidad legítima de trabajar con un profesional que tiene años de experiencia traduciendo datos económicos en algo más accesible para el público en general.
82. Portal de datos abiertos de la UE
El Portal de datos abiertos de la UE es un proyecto que se creó a raíz de una decisión tomada por la Comisión Europea. En este sitio, las instituciones de la UE ofrecen datos para que el público los vea y los use sin restricciones de derechos de autor y disponibles sin cargo. Los conjuntos de datos incluyen los datos de referencia de CORDIS, el registro de transparencia e incluso una lista completa de las personas, entidades y grupos contra los que la UE ha emitido sanciones financieras. Además, los datos están disponibles en varios formatos digitales.
83. Red de datos abierta
Open Data Network es un sitio que permite a los usuarios buscar datos por región y ciudad. Con una página de inicio clara e intuitiva en el sitio, los investigadores tienen la capacidad de buscar por categoría de datos, ciudad e incluso por preguntas de muestra. En cada página, después de revisar las categorías de datos o las preguntas de muestra, también hay enlaces convenientes a más conjuntos de datos. La organización de los datos por sí sola hace que Open Data Network sea un sitio que vale la pena explorar.
84. Matriz de tierra
Landmatrix es un sitio que ofrece una base de datos en línea para transacciones de tierras con la intención de promover una mayor transparencia en las adquisiciones. Esencialmente, esta herramienta se puede utilizar para visualizar y dar sentido a las diversas transacciones de tierras. Los datos siempre están mejorando, cambiando y ajustándose para mejorar la precisión de la información disponible. Hasta la fecha, Landmatrix tiene información sobre más de 1.000 transacciones. Es una fuente que vale la pena explorar para los investigadores.
85. Programa de las Naciones Unidas para el Desarrollo
El Programa de las Naciones Unidas para el Desarrollo alberga una gran cantidad de datos útiles sobre el desarrollo humano en todo el mundo para que el público los explore. Con fechas que generalmente van desde 1990 hasta 2015 en muchos de estos conjuntos de datos, los índices incluyen tablas completas como las tendencias en el índice de desarrollo humano, el índice de desigualdad de género y la brecha de género a lo largo de la vida. Los investigadores pueden buscar los datos directamente a través de la barra de búsqueda y también ir por país si la intención es recorrer el gráfico.
86. OCDE
La OCDE, conocida como la Organización para la Cooperación y el Desarrollo Económicos, tiene un sitio que se enfoca en ayudar a los gobiernos en iniciativas antipobreza y prosperidad a través de la estabilidad y el crecimiento económicos. En este sitio, los investigadores encontrarán materiales revisados por pares, publicaciones, así como estándares y argumentos a favor del establecimiento de estándares. La OCDE también alberga un libro de hechos que proporciona una sólida herramienta de referencia económica para acompañar una serie de encuestas y predicciones sobre las perspectivas económicas que se pueden encontrar en sus páginas.
87. Departamento de Salud y Servicios Humanos de EE. UU.
El Departamento de Salud y Servicios Humanos de los EE. UU. opera un sitio que brinda información sobre el Consejo del Presidente sobre Estado Físico, Deportes y Nutrición. Con hechos y datos recopilados con la ayuda de varios expertos en campos relacionados, como chefs y atletas. Además, el sitio también tiene una gran cantidad de estadísticas. Los investigadores pueden encontrar datos sobre la actividad física de los niños, los hábitos de fortalecimiento muscular de los adultos, así como información sobre los hábitos dietéticos del público, así como sobre la obesidad, entre muchos otros datos y estadísticas.
88. Socios en el acceso a la información para la fuerza laboral de salud pública
Partners in Information Access for the Public Health Workforce es un proyecto que surgió como resultado de organizaciones de salud pública, agencias gubernamentales de los EE. UU. y bibliotecas especializadas en ciencias de la salud. Las páginas de temas en este sitio incluyen temas tales como subvenciones y financiamiento, promoción de la salud y educación para la salud, y literatura y pautas. A través de la sección Temas de salud pública, también hay datos sobre temas como el bioterrorismo, la genómica de la salud pública y la salud pública dental, por nombrar algunos temas.
Durante las últimas tres décadas, United Health Foundation ha proporcionado información sobre clasificaciones de salud para su uso como medio para medir la salud pública. El sitio alberga numerosos informes y publicaciones que incluyen informes sobre la salud de quienes han servido, informes de personas mayores, salud de mujeres y niños, informes anuales e incluso resúmenes sobre temas importantes para el campo. Utilice el mapa interactivo para explorar por región y obtener más información. También hay una barra de búsqueda para navegar más si los investigadores buscan algo más específico.
En los Estados Unidos, Medicare es el medio principal en el que muchas personas confían para obtener un seguro médico y acceder a tratamientos médicos. Junto con los servicios que ofrece en tiempo real, Medicare también ofrece datos sobre los estándares y la calidad del tratamiento en las instalaciones y hospitales a través de su tabla y regla de comparación. Es el conjunto de datos oficial utilizado por el sitio web Hospital Compare y está lleno de datos que se pueden descargar en Excel para facilitar el acceso.
91. Vigilancia, epidemiología y resultados finales (SEER)
Surveillance, Epidemiology and End Results, también conocido como SEER, tiene un sitio que es especialmente útil como fuente de información sobre estadísticas sobre el cáncer. Alberga resúmenes estadísticos que permiten la investigación sobre los números asociados con el cáncer que se pueden ordenar por el sitio del cáncer, el origen étnico, la raza, la edad, el sexo e incluso por tipo de datos. El sitio también alberga publicaciones, conjuntos de datos y software que los investigadores pueden utilizar para un análisis aún más profundo.
Amnistía Internacional es una organización que durante mucho tiempo ha sido defensora de los derechos humanos y la justicia en todo el mundo. También alberga una gran cantidad de datos sobre el estado de los derechos humanos en todo el mundo, así como información sobre atrocidades y crímenes de lesa humanidad específicos en diferentes puntos como parte de su informe anual. Los investigadores pueden usar la información para hacer comparaciones entre diferentes años y ver cómo los diferentes países han evolucionado o retrocedido en el área de los derechos humanos.
93. Grupo de Análisis de Datos de Derechos Humanos
Desde su concepción hace 25 años, el Grupo de Análisis de Datos de Derechos Humanos ha estado aplicando principios científicos a las violaciones de derechos humanos en diferentes países del mundo. El sitio alberga publicaciones que han sido publicadas en medios de comunicación acreditados como el Washington Post y publicaciones formales a través de editoriales Macmillan ordenadas por año. Junto con sus publicaciones organizadas desde hace años, también hubo proyectos en todo el mundo. Para una mirada más técnica a las violaciones de los derechos humanos, esta es una gran búsqueda.
94. Datos de Relaciones Internacionales y Derechos Humanos
Este sitio alberga bases de datos compiladas por numerosas organizaciones acreditadas, universidades e incluso agencias gubernamentales. Ejemplos de estos serían el Proyecto Manifiesto, el Proyecto de Minorías (en Riesgo), el Distrito de Estados de Bienestar Comparado y la Base de Datos de Conflictos Armados. Hay algunos proyectos como el Proyecto Polity IV que se remontan al siglo XIX. Mientras tanto, proyectos como el Instituto Internacional de Investigación para la Paz de Estocolmo (SIPRI) miden las transferencias de armas, el gasto militar internacional y las tendencias de seguridad. La mejor manera de apreciar los datos sería dirigirse al sitio y explorar.
95. Programa de datos sobre conflictos de Uppsala
El Departamento de Investigación de Paz y Conflictos de Uppsala, a menudo denominado UCDP, alberga una base de datos masiva llamada Enciclopedia de Conflictos de UCDP. Este es un sitio que permite a los usuarios hacer clic y explorar los datos que el departamento ya ha desagregado. Se puede hacer clic en los investigadores a través del sitio web y también descargarlos para su posterior manipulación y análisis. Este es un recurso con el que se puede contar y referenciar para obtener información de calidad distribuida de manera accesible.
96. Departamento de Trabajo de los Estados Unidos
El Departamento de Trabajo de los Estados Unidos alberga una gran cantidad de datos económicos sobre estadísticas de desempleo y empleo. Naturalmente, estos números incluyen bases de datos que incluyen estadísticas de despidos masivos, proyecciones de empleo, ofertas de trabajo y rotación en el lugar de trabajo, estadísticas nacionales de empleo e incluso estadísticas de comparación laboral internacional. El sitio proporciona información actualizada y precisa, mientras que el Departamento de Trabajo realiza un seguimiento de todo. Este es un recurso confiable con respaldo del gobierno para fines de investigación.
97. Administración de pequeñas empresas
La Administración de Pequeñas Empresas ha sido durante mucho tiempo un recurso comprobado para empresarios y otros aspirantes a empresarios. Este sitio alberga una gran cantidad de estadísticas sobre el empleo, así como información que permite a los investigadores realizar estudios de mercado y análisis competitivos. Aquí los investigadores pueden encontrar números, estadísticas y herramientas que pueden usarse para descubrir datos adicionales. Para obtener información sobre estadísticas de pequeñas empresas desde la perspectiva de un empleador y una empresa, este es un recurso excelente al que los periodistas pueden acudir en cualquier momento.
98. Crowdpac
Crowdpac es una plataforma que permite a los candidatos políticos recaudar fondos y organizarse. Basándose en gran medida en la idea de que hay una cantidad de candidatos al Congreso en cada elección que básicamente se ejecutan sin oposición, este sitio permite a los ciudadanos comprometidos organizar su apoyo. Con artículos que discuten temas políticos relevantes como gerrymandering junto con temas adicionales como derechos civiles y seguridad nacional, este sitio representa una excelente oportunidad para comprender y averiguar qué está sucediendo en la escena política de base.
99. Gallup
Este sitio es el hogar de las famosas encuestas de Gallup. Gallup se especializa en análisis que permiten a los tomadores de decisiones organizacionales resolver problemas a través de un enfoque basado en datos para la resolución de problemas. Además, el dispositivo sugerido por Gallup suele ser útil para soluciones de conducción. Esta es una fuente que tiene reconocimiento como el estándar de oro en datos y análisis avanzado. Simplemente navegue por el sitio para explorar informes sobre todo, desde el estado del lugar de trabajo global hasta la discusión sobre la productividad de EE. UU.
100. Biblioteca de Berkeley
Berkeley Library alberga una compilación completa de estadísticas y datos para la investigación de Ciencias Políticas en su sitio. En esta página, los investigadores encontrarán una tonelada de enlaces que les brindan acceso a una serie de conjuntos de datos, así como la capacidad de crear el suyo propio. Entre estos se encuentran las Estadísticas históricas de los Estados Unidos (HSUS), la Millennial Edition, Data Planet, ProQuest Statistical Insight y el Consorcio interuniversitario para la investigación política y social. Hay varias horas de datos para pasar.
Para aquellos que no saben, RAND Corporation es una organización que se especializa en la investigación de los desafíos de las políticas públicas. Con clientes y una cartera que abarca todos los niveles de gobierno, la corporación es una fuente de investigación de calidad para la toma de decisiones. La sucursal estadounidense de la corporación alberga un conjunto de estadísticas de bases de datos en su sitio web. Aquí los investigadores pueden encontrar información sobre educación K-12, salud, negocios y economía, entre otras categorías que abordan temas que son relevantes para el bien público.
102. Centro Roper para la Investigación de la Opinión Pública
Dirigido y operado a través de la Universidad de Cornell, el Centro Roper para la Investigación de la Opinión Pública se especializa en recopilar, distribuir y preservar datos de opinión pública. Como ejemplo del tipo de información que puede descubrir el Centro Roper, los investigadores pueden tener acceso a los datos de las elecciones estadounidenses, así como a un enlace a un archivo de más de 23 000 conjuntos de datos. Ya sea que los periodistas busquen la reacción del público a la política oa un problema de salud reciente, es casi seguro que este sitio tenga información.
Desarrollado y operado por la Oficina de Transporte, este sitio tiene datos que abarcan una amplia gama de temas relacionados con el transporte. Los recursos de este sitio incluyen informes sobre energía, seguridad de los pasajeros, energía, rendimiento del sistema, economía del transporte, infraestructura y transporte de carga. Los usuarios pueden incluso ordenar y acceder a los datos ofrecidos en este sitio por ubicación y geografía. Este es un sitio que permite a los investigadores encontrar todo lo que podrían esperar saber sobre temas relacionados con el transporte.
104. Viaje de comercio o negocios
Travel Trade es un sitio que aloja datos sobre salidas de ciudadanos estadounidenses que datan de 1996 a 2016 a partir de este escrito. El objetivo declarado de este recurso es ayudar a los miembros interesados del público en general a comprender cómo ha funcionado el turismo mundial y el turismo internacional a lo largo de los años. Disponible tanto para descargar como para ver en línea, esta es una información accesible. Los investigadores pueden usar fácilmente estos datos para encontrar tendencias y hacer comparaciones.
105. esquivar
Skift es un sitio que se enfoca en proporcionar inteligencia y datos a la industria de viajes. Entre otras fuentes de datos, la empresa organiza investigaciones, conferencias y boletines informativos para que los suscriptores e investigadores puedan elegir. Skift examina temas que las personas en el sector de viajes querrían saber, como adónde viaja cada vez más la gente, la identificación de nuevos mercados y mucha información adicional sobre tecnología de viajes que los investigadores tienen la opción de explorar.
106. Geoba.se
Geoba.se es el sitio perfecto para las personas que buscan datos y nada más que datos sobre una ciudad o lugar. Usando el motor de búsqueda en la página de inicio, encontrar coordenadas, información para viajes, clima e incluso imágenes de la cámara web local está a solo unas simples pulsaciones de teclas. El sitio también alberga una página que proporciona información sobre clasificaciones mundiales que pueden reducirse por región y país. En resumen, este es un recurso que proporcionará datos y estadísticas puros.
US Travel alberga un sitio operado y mantenido por el Departamento de Estado de EE. UU. La misión declarada del sitio es proteger las vidas de los ciudadanos estadounidenses que viajan al extranjero. Como tal, esta fuente alberga estadísticas, información e informes sobre temas como pasaportes estadounidenses, visas estadounidenses, adopciones internacionales, muertes en el extranjero y secuestros internacionales de hijos por parte de padres. La información se puede utilizar al planificar viajes, pero también se puede utilizar para identificar tendencias a largo plazo con estadísticas que abarcan desde 1996 hasta 2016.
108. Servicio de datos del Reino Unido
Financiada por el Consejo de Investigación Económica y Social, la colección del Servicio de Datos del Reino Unido publica una amplia gama de datos. Este sitio tiene información que incluye materiales como datos comerciales para encuestas internacionales, encuestas patrocinadas por el gobierno del Reino Unido e incluso datos del censo del Reino Unido. Básicamente, el sitio web fue diseñado teniendo en cuenta las necesidades de estudiantes e investigadores. Además, existen guías, recursos e instructivos que ofrecen guías y recursos que ayudarán a los investigadores a comprender y utilizar las herramientas de este sitio rápidamente.
109. Datos.gov.au
Gestionado y publicado por el gobierno australiano, Data.gov.au ofrece fácil acceso y búsqueda de datos abiertos. Este sitio señala explícitamente que los datos del gobierno pueden usarse para desarrollar herramientas y aplicaciones que a su vez pueden usarse en beneficio de los australianos. No solo se proporciona acceso a los conjuntos de datos abiertos, sino que también hay datos no publicados a los que se puede acceder pagando una tarifa. Para los investigadores que quieran realizar un análisis aún más profundo, el sitio también ofrece un conjunto de herramientas de datos.
110. Gorjeo
Todo el mundo conoce Twitter por sus conversaciones trepidantes, sus mensajes cortos y su estatus en la cultura popular como centro de noticias de última hora. Sin embargo, lo que mucha gente no sabe es que Twitter también tiene herramientas para desarrolladores que facilitan el filtrado y el descubrimiento de información. Estas herramientas incluso permiten a los investigadores ver tendencias y filtrarlas por geografía. Ya sea leyendo sobre hashtags de tendencia o explorando las herramientas para desarrolladores, Twitter es un recurso que los periodistas han estado utilizando durante bastante tiempo.
111. Instagram
Instagram no es sólo para que te gusten las fotos de lindos gatos y las adorables fotos de bebés. O al menos no tiene por qué ser así. La aplicación cuenta con un conjunto sorprendentemente sofisticado de herramientas para desarrolladores que facilitan la comprensión y la investigación de la audiencia. Además, los hashtags y las pistas reveladas por las fotos que la gente publica, así como por las personas que son etiquetadas en ellas, pueden ser un tesoro de información. Instagram es una forma útil de descubrir las tendencias en diferentes sectores.
112. cuatro cuadrados
Para el tipo de investigación en la que la ubicación importa, Four Square es una fuente de datos útil debido a su enorme base de datos y toda la información que ha recopilado. En la superficie, tiene una guía de la ciudad que brinda recomendaciones a los usuarios sobre la fortaleza de la comunidad. Four Square también cuenta con herramientas para desarrolladores que permiten acceder a información adicional a través de la base de datos de lugares. Los periodistas pueden utilizar esto para obtener más información sobre ubicaciones específicas y sobre las personas que utilizan la aplicación.
113. New York Times
Considerado por muchos un miembro estimado del Cuarto Poder, son muy pocos los periodistas que no han oído hablar del New York Times. Sin embargo, lo que a menudo se pasa por alto es el uso del New York Times como fuente de datos a través de su API. Los investigadores pueden encontrar artículos que datan de 1851 por mes, buscar artículos e incluso encontrar reseñas de libros. Esta API permite realizar búsquedas basadas en vistas, recursos compartidos y correos electrónicos e incluso buscar y acceder a comentarios.
114. AP
Associated Press ocupa un lugar permanente en la cultura popular como fuente de noticias oportunas y precisas. Gracias a sus herramientas de desarrollo, también es una fuente útil de datos para periodistas. Al momento de escribir este artículo, los investigadores pueden usar estas herramientas para crear su propia edición mientras descargan imágenes y videos. El nivel de contenido parece depender del tipo de plan que utilizan los investigadores, pero la API de Associated Press permite, no obstante, a los usuarios llevar el proceso de investigación a otro nivel.
115. cinco treinta y ocho
Es posible que los periodistas ya estén familiarizados con Nate Silver y Five Thirty Eight y su modelo estadístico debido a sus predicciones a veces inesperadas pero generalmente correctas. Five Thirty Eight tiene un GitHub que aloja conjuntos de datos y codificación que se ha utilizado a lo largo de la historia del sitio. Los conjuntos de datos presentan temas divertidos como datos sobre malos conductores, los Vengadores y la encuesta sobre etiqueta de vuelo. Al mismo tiempo, también hay expedientes que abordan cuestiones un poco más graves, como la seguridad de las aerolíneas y los delitos de odio.
116. IMDb
Muchos consideran que IMDb es el sitio más completo de la web con respecto a la industria del cine y la actuación. Si hay una película a punto de estrenarse y la gente quiere saber quién actúa en ella o ver la reacción general del público cinéfilo, es probable que lleguen a este sitio en algún momento durante su búsqueda. IMDb también alberga una serie de conjuntos de datos que se actualizan todos los días y están disponibles para uso comercial y no comercial.
117. KAPSARC
KAPSARC es un portal de datos que alberga un total de 923 conjuntos de datos con información específica sobre datos energéticos. Estos conjuntos se dividen en algunos temas generales sobre el uso y el suministro de energía y otros factores relevantes como políticas, demografía, medio ambiente, comercio, agua e información económica. Para los investigadores interesados en la energía y cómo se utiliza en diferentes industrias y sectores, KAPSARC es una de las fuentes de datos energéticos más completas de la web.
118. Macro de activos
Asset Marco es un sitio que proporciona datos financieros históricos e indicadores macroeconómicos. Estos datos cubren más de 75.000 acciones, divisas, materias primas y bonos en todo el mundo. Además, el sitio cuenta con más de 120.000 indicadores macroeconómicos que los usuarios pueden utilizar para explorar los datos financieros de diferentes países. Además de todos estos datos del mercado financiero, el sitio también analiza estrategias de inversión. Esta fuente es única debido al gran volumen de información que se puede encontrar.
119. Servicios web del gobierno de EE. UU. y fuentes de datos XML
Los servicios web del gobierno de EE. UU. y las fuentes de datos XML están alojados en un sitio llamado USGovXML.com. Aquí, los usuarios pueden navegar a través de las diferentes fuentes de datos XML y servicios web que ha proporcionado el gobierno de EE. UU. Este simple acto de preservación mantiene esas fuentes web transparentes y accesibles al público. Para los investigadores que monitorean regularmente este índice en general, es posible encontrar una historia en los datos en caso de que haya un cambio repentino en los datos XML.
120. higo compartido
Figshare es un sitio que alberga más de 5000 piezas de contenido científico disponibles para investigación y citación académica. Además de la información allí, el sitio está diseñado para ofrecer a los investigadores una ubicación única con el fin de compilar, cargar, almacenar y gestionar la investigación que encuentren. Matemáticas, ciencias de la salud, ingeniería, química, ciencias biológicas y ciencias sociales figuran como categorías destacadas. Este sitio es una gran fuente para los periodistas que buscan más recursos académicos para el sitio.
121. Datos vinculados
LinkedData es un sitio dedicado a la idea de encontrar nuevas formas de conectar datos de Internet que antes no estaban vinculados. Aquí, los usuarios encontrarán tutoriales, guías y conjuntos de datos que harán avanzar la historia. Todos los conjuntos de datos se centran en el tema de involucrarse con la comunidad de datos vinculados y, además de la lista de compras de datos vinculados, la mayoría se clasifican como URI desreferenciables con o sin el formato RDF complementario. Para obtener más información sobre esta comunidad, este sitio es una visita obligada.
122. El minero web
Web Miner es el lugar perfecto para los investigadores que desean recopilar todos los datos genéricos que puedan encontrar con el programa. Este sitio alberga bases de datos de ejemplo, como restaurantes de EE. UU., códigos SWIFT de bancos de todo el mundo, gasolineras de EE. UU., atracciones turísticas de EE. UU. y aplicaciones de Google Play, entre otras listas masivas. Al menos, es un sitio que hará que sea más fácil y rápido para los periodistas examinar y descubrir cantidades masivas de datos en mucho menos tiempo.
123. Centro de datos
Data Hub se enorgullece de ser un lugar donde los usuarios pueden encontrar y publicar datos de la manera más rápida y eficiente posible. El sitio en sí alberga una serie de conjuntos de datos. El índice de precios de la vivienda (Case-Shiller), el precio mensual del oro y las tendencias actuales del dióxido de carbono atmosférico son los tres más populares. Además de los datos, el sitio también alberga una serie de tutoriales que los usuarios pueden seguir para aprender más sobre cómo navegar por los distintos tipos de datos disponibles.
124. Enigma público
En su sitio, Enigma Public se autodenomina “la colección más amplia de datos públicos” disponible en la web. Los conjuntos de datos se dividen en una de cuatro categorías amplias en FOIA, Essentials, Newsworthy y Under the Radar. Algunos de los datos de este sitio incluyen salarios de empleados de la Casa Blanca y licencias federales activas de armas de fuego. Después de crear una cuenta gratuita, los usuarios pueden acceder a cualquiera de las categorías de datos que están disponibles para la visualización.
125. yahoo
La mayoría de los usuarios de la web están familiarizados con el nombre Yahoo debido a empresas como Yahoo! Noticias y Yahoo! Finanzas entre las muchas propiedades en línea de la empresa. De interés para investigadores y periodistas es el hecho de que Yahoo también alberga una gran cantidad de conjuntos de datos, incluidos Yahoo! Calificaciones de usuarios de música de canciones con metainformación de artista, álbum y género, v. 1.0 y Yahoo! Calificaciones de usuarios de películas e información descriptiva de contenido, v.1.0, por nombrar dos. Los periodistas que buscan nuevas estadísticas no pueden equivocarse con esta fuente.
126. 1000 genomas
1000 Genomas alberga un proyecto del mismo nombre que duró de 2008 a 2015. El propósito del proyecto era encontrar todas las variaciones genéticas que podrían ocurrir en al menos el 1% de las poblaciones en estudio. Junto con las publicaciones que surgieron gracias a este proyecto, también hubo conjuntos de datos masivos que incluían bases de datos separadas de celdas variantes, archivos de secuencia sin procesar y disponibilidad de muestras. Estos datos se pueden explorar o descargar.
127. CBOE
CBOE es una bolsa de futuros que se centra principalmente en futuros de volatilidad. En particular, el sitio presenta una gran cantidad de materiales relacionados con los futuros que aparecen en el índice de volatilidad registrado del sitio. El sitio alberga datos de mercado de todo tipo, incluidos datos históricos, estadísticas diarias del mercado y precios de liquidación diaria de futuros VX. Para los periodistas que buscan datos de mercado de calidad, CBOE es un sitio que puede proporcionar esa información en un formato fácil de seguir y comprender.
128. Reserva Federal de San Luis
El Banco de la Reserva Federal de St. Louis es uno de los centros financieros más importantes de su región, si no el más. En el sitio web, los investigadores pueden examinar directamente documentos de trabajo, datos económicos, publicaciones y servicios de información. En otras palabras, no falta información sobre el pensamiento actual y pasado de la Reserva Federal de St. Louis en términos de política, así como sobre la capacidad de evaluar la eficacia del Banco de la Reserva Federal de St. Louis. Para los periodistas de negocios, finanzas y economía, este es un recurso de información de primer nivel.
129. OANDA
OANDA es una popular plataforma de negociación de acciones en línea, que opera principalmente con CFD y divisas. Además de las muchas funciones agregadas al comerciante con la intención de atraer comerciantes en línea, OANDA también alberga una gran cantidad de datos de tasas históricas, así como información histórica sobre el conversor de divisas en el sitio. Junto a todos estos datos, el sitio también ofrece información con estrategias de inversión junto con noticias y análisis de mercado. Ni siquiera es necesaria una cuenta para acceder a la mayoría de estos datos.
130. abdominales
La Oficina Australiana de Estadísticas, o ABS, a diferencia de su contraparte estadounidense, ofrece datos objetivos, información económica e investigaciones sobre una amplia gama de temas que son relevantes para el país. Directamente en el sitio, los investigadores pueden buscar datos estadísticos sobre indicadores comerciales, atención médica, vivienda, finanzas, comercio internacional, vivienda, salud mental, así como índices de precios e inflación. Los periodistas pueden realizar búsquedas para encontrar encuestas e información más antiguas que también pueden clasificar la información por región.
Originalmente concebida y operada por la Autoridad del Gran Londres, la Base de Datos de Londres es el intento de Londres de hacer que los datos de Londres sean más accesibles al público. El objetivo final es brindar a las personas acceso a esta información y al mismo tiempo animarlas a utilizarla de forma gratuita como quieran. En este sitio web, los usuarios pueden buscar datos por temas como arte y cultura, crimen y seguridad comunitaria, educación y salud. Los periodistas interesados en este tipo de datos ahora pueden obtenerlos directamente del gobierno local.
132. Estadísticas Nueva Zelanda
El gobierno de Nueva Zelanda alberga una gran cantidad de estadísticas y datos para que los investigadores profundicen y analicen en este sitio. Esta información se puede examinar utilizando la barra de búsqueda en la parte superior, filtrando por ubicación y región, así como por tema. Algunos de los temas incluyen indicadores económicos, salud, ingresos y trabajo, sectores industriales, medio ambiente y negocios. Entre las fuentes de noticias adicionales y los comunicados que destacan diversos hallazgos y estadísticas, los periodistas descubrirán todo tipo de estadísticas específicas de Nueva Zelanda a través de este sitio.
133. Oficina de Meteorología del Gobierno de Australia
Dirigido y operado en última instancia por el Gobierno de Australia, el sitio web de la Oficina Australiana de Meteorología presenta información meteorológica relativa a las distintas ciudades y regiones de Australia. Según el sitio, esta agencia se estableció como un medio para ayudar a los australianos a enfrentar el clima que los rodea a través de una combinación de advertencias y consejos. Aquí los investigadores podrán encontrar perspectivas estacionales, almacenamiento de agua, pronósticos de precipitaciones, variabilidad climática y pronósticos de caudales estacionales. En este sitio encontrará cobertura precisa y confiable sobre el clima australiano.
134. Lente de grupo
Este sitio está en la web por cortesía de GroupLens del Departamento de Ingeniería y Ciencias de la Computación de la Universidad de Minnesota. El sitio ofrece publicaciones y conjuntos de datos con fines de investigación. Hay un total de alrededor de seis conjuntos de datos. Entre los conjuntos nombrados, habría algunos titulados Book-Crossing, MovieLens y HetRec 2011. En resumen, este es un recurso útil para los periodistas que buscan comprender mejor cómo utilizar los datos proporcionados.
135. Nuggets de KD
KD Nuggets es un sitio que se enfoca principalmente en brindar a las personas ciencia de datos, análisis de negocios, aprendizaje automático y minería de datos. Hay una página en el sitio que tiene una lista completa de conjuntos de datos que la gente usa para explorar más la minería de datos y big data con conjuntos de datos como Bioassay Data, Asset Marco, DataMarket, Casualty Workbench, Data Ferrett y Datamob, todos vinculados. Este es un recurso fantástico para periodistas que prefieren tener toda la información en una sola página.
137. microsoft
Cualquiera que haya usado una PC o una computadora portátil probablemente haya oído hablar de Microsoft, al menos de pasada. Curiosamente, además de las PC, las portátiles y el software, Microsoft también alberga una gran cantidad de investigaciones y publicaciones. Esto incluye avances como la búsqueda de la empresa por crear máquinas alfabetizadas, así como ciencia de datos basada en la nube. También hay información adicional sobre las herramientas que Microsoft está desarrollando, como Visual Studio Code Tools y los desarrollos en IA que representan.
138. RDataMinería
Exactamente como dice en la lata, R Datamining es un recurso sobre R y minería de datos. El sitio proporciona numerosos ejemplos y documentos que brindan una perspectiva profunda sobre la minería de datos y la minería de datos con R. Además, también hay enlaces a cursos de capacitación como el curso corto ofrecido por la Universidad de Canberra. Esto incluye enlaces a presentaciones y conjuntos de datos gratuitos, así como conjuntos de datos que cubren temas como aviones, líneas aéreas y datos de rutas, así como enlaces a sitios como GeoDa.
139. Investigación colaborativa en neurociencia computacional: intercambio de datos
Collaborative Research in Computational Neuroscience, también conocida como CRCN, tiene varios conjuntos de datos a los que se puede acceder a través de su sitio. Los conjuntos de datos se clasifican según las distintas partes del cerebro, como la corteza visual, el hipocampo, la corteza motora, los movimientos oculares aviares y la aplysia, como solo algunos ejemplos. Estas carpetas también incluyen desafíos, herramientas, simulaciones y métodos. La capacidad de compartir estos datos los convierte en un recurso aún mejor para utilizar en la investigación.
140. Archivo del banco de datos de proteínas
Según su sitio web, el archivo del Protein Data Bank ha sido un recurso de primer nivel sobre ácidos nucleicos, las estructuras tridimensionales de las proteínas y ensamblajes complejos desde 1971. Creado con la misión explícita de mantener esta información en el dominio público, los investigadores pueden ir aquí para ver la validación. informes y diccionarios de datos en línea. También hay estadísticas de uso y crecimiento de datos disponibles para clasificación y análisis basados en la web, así como para descarga. Lo mejor de todo es que el sitio siempre agrega nueva información.
141. El proyecto PubChem
PubChem como proyecto oficial fue diseñado con el propósito de informar al público sobre lo que las moléculas pequeñas son capaces de hacer desde un punto de vista biológico. El sitio está vinculado a tres bases de datos, incluidas PubChem Compound, PubChem Substance y PubChem BioAssay. Además, el sitio también permite buscar similitudes entre diferentes proteínas. Para los investigadores que llevan su análisis de datos al siguiente nivel, el sitio también ofrece codificación y consejos gratuitos.
142. Médico Coremine
Coremine Medical es un recurso invaluable para cualquiera que busque información sobre biología, salud y medicina. Ahora que la capacidad de minería de textos biomédicos de PubGene se ha implementado en su forma actual, Coremine es también una de las fuentes de información biomédica más flexibles que existen. Este sitio mostrará enlaces entre conceptos e ideas en un formato visualmente atractivo y de fácil comprensión que de otro modo no se habría notado. Es fácilmente una de las fuentes de datos biomédicos más completas disponibles para los periodistas.
143. tu tiempo
Tu Tiempo es una fuente increíble de datos meteorológicos y climáticos para todos los países del mundo. Con este recurso, es fácil encontrar promedios anuales, mensuales y diarios para prácticamente todas las ciudades y regiones del mundo. Además, los usuarios también pueden buscar en la base de datos de más de 115 millones de registros llenos de datos históricos en los que cualquier persona puede realizar búsquedas. Dependiendo de la región que se busque, es posible encontrar datos que se remontan a 1929.
144. Recursos de red complejos
Este es un sitio que brinda acceso a una gran cantidad de datos que se utilizaron por primera vez en sus experimentos por computadora. La lista completa de conjuntos de datos que enumeran los tipos de datos, incluidos gráficos de noticias, gráficos biológicos, gráficos de citas, gráficos de colaboración, gráficos de ingeniería y gráficos semánticos. La página también enlaza con una lista de fuentes que contienen mucha información, como el conjunto de datos que examinó aproximadamente 3 millones de patentes estadounidenses. La página también cuenta con una impresionante compilación de conjuntos de datos de redes complejas.
145. Scopus
Scopus es una herramienta que permite a las personas encontrar rápida y fácilmente citas académicas y de investigación. El sitio ofrece una base de datos increíblemente extensa de investigaciones que se han realizado en todo el mundo en una serie de campos que incluyen sectores como la medicina, la tecnología, las ciencias sociales y las artes y las humanidades. Utilice Scopus para capturar fuentes académicas que podrían haberse pasado por alto. Después de todo, en muchos círculos la calidad de una fuente académica puede ser casi tan importante como la información que proporciona.
146. stanford
La reputación de Stanford como institución académica prestigiosa no surgió de la nada. La excelencia se nota en sus cursos relacionados con la programación. El sitio también alberga una serie de conjuntos de datos que incluyen detalles como información de redes sociales. Hay conjuntos de datos centrados en los círculos sociales de Facebook, la solicitud de administrador de Wikipedia, los círculos sociales de Twitter y Google +. Las redes de comunicación y Amazon Product Network también tienen sus propios conjuntos de datos.
147. Universidad de Milán
El Departamento de Ciencias de la Información de la Universidad de Milán gestiona y gestiona una página web conocida como Laboratorio de Algoritmos Web. Este sitio alberga muchos conjuntos de datos que están ahí para explorar. Estos incluyen gráficos en relación con las redes sociales, gráficos de Facebook, instantáneas del proyecto DELIS y una breve lista de datos diversos. La información disponible aquí se puede ver en línea y descargar si así lo desea, lo que lo convierte en uno de los conjuntos de datos más accesibles de su tipo en la web.
148. Repositorio de datos de la red UCI
El repositorio de datos de la red UCI es un sitio dedicado a adoptar un enfoque científico para el estudio de las redes. En la página de recursos, los investigadores encontrarán enlaces a directorios de conjuntos de datos seleccionados por organizaciones y grupos de investigación, así como por individuos. También tiene una colección de conjuntos de datos que normalmente se utilizarían para el análisis de redes sociales. Quienes profundicen en los datos estarán encantados de descubrir que estos conjuntos también están disponibles para descargar.
149. CAÍDA
CAIDA, o el Centro para el Análisis Aplicado de Datos de Internet, recopila una amplia gama de datos de diferentes ubicaciones, a menudo con la ayuda de diferentes organizaciones e individuos. Hay conjuntos de datos alojados en este sitio como AS Relationships, DDOS Attacks, Telescope y sus relacionados junto con otros datos. Las categorías incluyen tráfico, topología, seguridad, resumen de gusanos y estadísticas de resumen de tráfico. Los conjuntos de datos pueden requerir solicitud de acceso, pero muchos, si no la mayoría, son públicos.
150. cangrejo
Crawdad, o el recurso comunitario para archivar datos inalámbricos en Dartmouth, es único debido a su enfoque en proporcionar datos inalámbricos a investigadores y otras personas que puedan tener interés en el tema. El sitio ofrece una serie de herramientas, así como acceso a numerosos conjuntos de datos. Entre los conjuntos enumerados se encuentran los referidos a Uso educativo, Caracterización de errores de bits, Diagnóstico de red, Conectividad oportunista, Computación con reconocimiento de ubicación y más para seleccionar. Los investigadores apreciarán este recurso cuanto más se sumerjan en él.
151. Administración de Información Energética de EE. UU.
A menudo denominada EIA, la Administración de Información Energética de EE. UU. se dedica a proporcionar al público datos anuales de servicios eléctricos. La información de estos datos cubre las existencias de combustibles fósiles, el consumo de combustible, información mensual y anual sobre la generación de electricidad y datos medioambientales, entre otras opciones. Los datos están ahí y disponibles para análisis desde los años 2001 a 2017. Todo lo que los investigadores tienen que hacer es navegar al sitio y descargar la información.
152. Datos oceanográficos británicos
Financiado por el Consejo Nacional de Investigación Ambiental, British Oceanographic Data es una de las fuentes de datos marinos más accesibles en Internet. Con una extensa base de datos que abarca corrientes, perfiles CTD, datos internacionales del nivel del mar, corrientes e incluso datos históricos de registradores de presión del fondo. Además, hay conjuntos de datos que se pueden encontrar en la Biblioteca de datos publicados que ofrece acceso adicional al catálogo. Esta es posiblemente una de las fuentes más extensas de información marina disponible en línea.
153. Factual
Factual proporciona datos de ubicación para publicidad y para uso en plataformas móviles. De particular interés para los investigadores son las herramientas de desarrollo que incluyen Engine Mobile SDK y las aplicaciones profesionales y de investigación completas de Observation Graph, así como Local Validation Stack. Con un nombre en el sitio web que enfatiza la pasión de la empresa por tomar datos en todo el mundo y encontrar nuevas formas de ponerlos en contexto, Factual tiene un claro compromiso con los datos y la búsqueda de oportunidades nuevas y poco ortodoxas para utilizarlos.
154. Áreas administrativas globales
Áreas administrativas globales es una geodatabase que muestra dónde están situadas las distintas áreas administrativas del mundo. Los datos recopilados de este tipo de base de datos se suelen utilizar en sistemas de información geográfica. Estos incluirían países y se dividen además en provincias, condados y departamentos, entre otros. La buena noticia para los periodistas es que todos estos datos están disponibles de forma gratuita y también pueden utilizarse para uso académico y general no comercial.
155. Geonombres
Geonames es un sitio que alberga una base de datos geográfica con millones de entradas, características únicas y nombres alternativos. Ofreciendo tanto una opción de exportación como acceso a través de una variedad de servicios web, esta es una base de datos que procesa aproximadamente 150 millones de solicitudes cada día. Gracias a las capacidades wiki de la base de datos, los usuarios pueden realizar ajustes y cambios en las entradas de la base de datos con relativa facilidad. Este es un gran recurso solo para las capacidades de alojamiento en varios idiomas.
156. Datos naturales de la Tierra
Natural Earth Data es un conjunto de datos de mapas que está disponible en el dominio público y lleno de información diseñada para su uso en software de creación de mapas para la creación de mapas de última generación. Las imágenes del producto final son claras y bien organizadas y los datos se pueden utilizar de inmediato. Este conjunto de datos incluye la presencia de datos de inteligencia y varios temas de datos vectoriales culturales, ráster y físicos. Creado originalmente teniendo en cuenta las necesidades y preferencias de los cartógrafos, este conjunto de datos es útil para cualquier persona interesada en la geografía.
157. Mapa de Open Street
Openstreet Map es menos un sitio web y más una colaboración entre usuarios que ahora proporciona servicios de mapas a aplicaciones, sitios y varios dispositivos de hardware. Este sitio adquiere nuevos datos cuando los usuarios ingresan información sobre puntos de referencia menos conocidos, como estaciones de tren, carreteras y senderos. El conjunto de datos completo está disponible de forma gratuita en el sitio y se puede descargar total o parcialmente. Para aquellos que opten por realizar una descarga parcial de los datos, también es posible descargarlos por región.
158. ciudad de chicago
La ciudad de Chicago es el hogar del campeonato Bulls de Michael Jordan y de su propio estilo único de pizza, y también tiene su propio portal de datos completo. Las categorías de conjuntos de datos abarcan una variedad de temas que incluyen administración y finanzas, ética, salud y servicios humanos, parques y recreación, seguridad pública y preservación histórica. En resumen, el portal de datos de la ciudad de Chicago alberga prácticamente cualquier cosa que pueda ser de interés para investigadores, formuladores de políticas y periodistas locales.
159. C KAN
CKAN es esencialmente el hogar en línea del proyecto de datos abiertos de la ciudad de Glasgow. Este sitio tiene conjuntos de datos sobre numerosos temas que son útiles para empresarios, formuladores de políticas, investigadores académicos y desarrolladores de aplicaciones. De los 360 conjuntos de datos alojados aquí, algunos están relacionados con la gobernanza de la ciudad, como el conjunto de datos sobre el stock de viviendas por tenencia, mientras que otros, como el conjunto de datos sobre ciclismo, son de particular interés para los residentes locales. Aquí hay todo tipo de información para los periodistas que cubren un tema más local.
160. Gobierno de la India
El Gobierno de la India tiene un sitio web que cubre recursos de datos y análisis en su versión del Proyecto de Datos Abiertos. Actualmente, hay aproximadamente 137.940 recursos que han sido vistos millones de veces en el sitio. La gran mayoría de estos archivos también están disponibles para descargar en el sitio. Ya sea que busque cifras sobre el presupuesto gubernamental o conjuntos de datos que aborden la salud y el bienestar familiar, es probable que este sitio tenga recursos que ofrecer.
161. Estadísticas SA
Este sitio está lleno de estadísticas, publicaciones y datos actualizados recopilados por el gobierno sudafricano. Aquí los investigadores descubrirán información sobre todo, desde encuestas sobre alimentos y bebidas hasta indicadores económicos, estadísticas de empleo, cifras de población e importantes estadísticas de salud. Es posible buscar los números por ciudad, tema e indicador según lo que se necesite. Este sitio alberga mucha información sobre el censo y al mismo tiempo publica publicaciones estadísticas, cuestionarios, códigos y clasificaciones, y políticas de precios.
162. Desarrollo de políticas e investigación
Este sitio se publica bajo el paraguas de la Oficina de Desarrollo de Políticas e Investigación del Departamento de Vivienda y Desarrollo de EE. UU. Publica periódicamente una gran cantidad de estudios de casos, publicaciones semestrales y publicaciones periódicas cada año. También ofrece una gran cantidad de conjuntos de datos que interesarían a los periodistas, siendo los alquileres de mercado justo, los límites de ingresos y los factores de inflación de fondos de renovación solo algunos de los conjuntos a los que el público tiene acceso en este sitio.
163. Datos de salud de Vital Net
En Vital Net Health Data, los investigadores encontrarán muchos conjuntos de datos grandes relacionados con la salud. Este sitio no aloja todos estos conjuntos sino que ofrece enlaces a conjuntos que las personas pueden visitar y encontrar información. Esta lista seleccionada enlaza a recursos como CDC Wonder, Eurocat, Health Data All Star y también al trabajo de organizaciones benéficas como la Asociación Norteamericana de Registros Centrales de Cáncer. Este es sin duda uno de los recursos de conjuntos de datos de salud más completos que existen.
164. Puente analítico
Analytic Bridge es un recurso dedicado a la inteligencia empresarial. Aquí los investigadores encontrarán debates sobre aprendizaje automático e inteligencia artificial, enlaces a seminarios web y conferencias, e incluso una pestaña de búsqueda de empleo. El sitio también alberga Data Science Central, que es la parte del sitio que se centra en big data. Con su comunidad activa y comprometida y su compromiso de brindar noticias e información, los periodistas interesados en las implicaciones de los datos para las empresas pueden ganar mucho con esto.
165. Archivo.org
Archive.org, conocida principalmente por sus esfuerzos por convertirse en una biblioteca pública en línea, alberga numerosos trabajos publicados, así como una importante colección de conjuntos de datos. El sitio cuenta con resultados del Censo de Internet de 2012, así como archivos del Dark Net Market de 2011 a 2015, e incluso un conjunto de datos de comentarios públicos de Reddit. Hay volcados de datos de Music Brainz y un conjunto de datos que contiene imágenes de portada de audio. Entre sus publicaciones y datos, archive.org tiene mucho material para que los periodistas lo revisen.
166. Torrentes Académicos
Este sitio web se refiere a sí mismo como un sistema diseñado para facilitar el intercambio y la descarga de grandes conjuntos de datos. Al utilizar la tecnología torrent para simplificar la distribución de datos, Academic Torrents se enorgullece de permitir a los investigadores descargar todo lo que necesitan rápidamente. El sitio también alberga artículos, cursos y colecciones para su visualización. Una búsqueda rápida entre los recursos disponibles revelará que hay toneladas de conjuntos de datos y colecciones disponibles para descargar aquí.
167. verso de datos
La mejor manera de abordar Dataverse es pensar en él como otro tipo de biblioteca. Aquí, los investigadores pueden buscar, descubrir y citar datos con facilidad y al mismo tiempo utilizar este sitio como depósito de su propia información. La materia cubierta incluye campos como las ciencias sociales, las ciencias agrícolas, la medicina, la salud y las ciencias de la vida, así como las ciencias de la tierra y el medio ambiente. Los grandes nombres con publicaciones en este sitio incluyen Gallup y la División de Geografía de la Oficina del Censo del Departamento de Comercio de EE. UU.
168. DATOS CU
Operando en conjunto con el Laboratorio de Datos de Ciencias Sociales de UC Berkeley, UC Data es el archivo más grande y conocido de la universidad. Este sitio ofrece ofertas en las áreas de estadística y datos de ciencias sociales. En este sitio los investigadores pueden acceder a los artículos, informes y documentos de trabajo producidos por los investigadores de UC Data. Los datos sin procesar cubren numerosas áreas de investigación que incluyen atención médica, bienestar y seguro social, demografía, votación y tecnología de la información, entre muchos otros temas.
169. Campamento de broma
Joe Kamp ofrece una guía completa para encontrar API y datos de fútbol y fútbol con fines de análisis de datos. Si los investigadores siguen los enlaces proporcionados en la página, habrá datos de código abierto disponibles a través de GitHub, así como acceso a API comerciales y gratuitas para facilitar el acceso. Dado que los datos y la codificación están disponibles en un sitio reconocido como GitHub, obtener este tipo de datos nunca ha sido tan fácil.
170. Sean Lahman
Sean Laham no es necesariamente un nombre que la gente escuche todos los días, pero su sitio alberga una de las estadísticas de bateo y lanzamiento más completas y profundas de Internet. Con cifras que cubren el período de 1871 a 2016, los datos se remontan literalmente a siglos atrás. El acceso y uso de los datos es gratuito bajo la licencia Creative Commons Share Alike 3.0 y se pueden descargar directamente en SQL y Microsoft Access, por nombrar algunos. Las estadísticas también se pueden descargar a través de GitHub.
171. Hoja Retro
Retro Sheet es una de las fuentes más extensas de Internet sobre estadísticas y datos de béisbol. El sitio incluye detalles como listas anuales e identificación de árbitros, jugadores y entrenadores. Para los años en los que fue relevante, los datos del juego de estrellas se incluyeron en los archivos de eventos junto con un conjunto de archivos de eventos para la postemporada y un pequeño archivo de discrepancia. Retro Sheet incluso tiene identificaciones de los parques de pelota para cada temporada. ¿Qué te parece eso de minucioso?
172. Desafío de datos de Hubway
Para aquellos que no están tan familiarizados con el programa, Hubway es el nombre de la bicicleta compartida con sede en el área metropolitana de Boston. Por supuesto, el sistema no registró ni publicó información de identificación, pero Hubway aún tiene la información básica de cada viaje realizado entre julio de 2011 y septiembre de 2012. Esto incluía detalles como el inicio y el final del viaje, así como la estación de recogida, por nombrar algunas categorías.
173. Vuelos abiertos
Open Flights es una base de datos que cuenta con información de más de 10.000 terminales de ferry, aeropuertos y estaciones de tren de todo el mundo. Los investigadores pueden encontrar la versión .csv compatible con Excel a través de GitHub y también pueden descargar los datos directamente en el sitio web. Usando el mapa en la página de inicio, es posible ver qué lugares específicos están en la lista y el sitio incluso llega a tener información de ruta disponible también. Se puede contactar a los propietarios del sitio para obtener información aún más actualizada.
174. MLVIS
MLVIS es un repositorio de datos que combina análisis visual con minería de datos en tiempo real. Esto hace posible explorar comprensiones más intuitivas de los datos incluso mientras se trabaja con conjuntos de datos enormes. Entre las muchas características y opciones disponibles a través de este sitio se encuentran datos de referencia y aprendizaje automático de datos no relacionales, junto con diferentes tipos de datos, como atribuidos y heterogéneos. Para mayor comodidad de los usuarios, esta información también se puede descargar en un formato único y coherente.
Open Data Inception es un sitio que ofrece enlaces a más de 2600 portales de datos. Al utilizar la barra de búsqueda en la parte superior, los investigadores pueden buscar portales y conjuntos de datos por categoría y tema. Además, también es posible utilizar el sitio como medio para encontrar la versión más actualizada del conjunto de datos que se está buscando. Aproveche la capacidad de ver portales de datos en formato de lista o en forma visual interactiva y comience a encontrar los datos necesarios.
176. OpenDataSoft
Disponible en francés, inglés y alemán, OpenDataSoft es una fuente que ofrece acceso a 480 millones de registros, 4 millones de celdas API y 9284 conjuntos de datos. Usando la barra de búsqueda en el medio de la página de inicio, los investigadores pueden ingresar una palabra clave o categoría y encontrar el conjunto de datos más apropiado desde allí. Para los periodistas, esta es una forma más rápida de encontrar los conjuntos de datos más relevantes necesarios para completar la investigación en cuestión. Visite el sitio para obtener más información.
177. Maestro de la nación
NationMaster es una fuente de datos completamente compilados de más de 300 países que se han organizado en más de 5000 categorías. Los datos cubren cifras que incluyen cifras sobre el porcentaje de muertes registradas, estadísticas de la Segunda Guerra Mundial e incluso información sobre guerras y pruebas nucleares. Los investigadores también encontrarán tablas, gráficos y gráficos circulares que permitirán una mayor visualización de los datos. En pocas palabras, se tratan tantos temas que siempre hay algo nuevo que encontrar en los datos.
178. Seguidorwonk
Twitter ha sido durante mucho tiempo un sitio de redes sociales popular para noticias de última hora y encontrar historias de actualidad. Followerwonk permite a los usuarios llevar su uso de Twitter al siguiente nivel. Esto incluye encontrar usuarios de Twitter con quienes conectarse, estudiar a los seguidores actuales y planificar la actividad de Twitter para obtener los máximos resultados. Hoy en día hay muchos reporteros y periodistas en Twitter que utilizan el sitio para establecer contactos y difundir historias. Followerwonk hace que los usuarios de Twitter sean más productivos en el sitio.
179. infochimpancés
Infochimps es un sitio que ofrece servicios basados en la nube que se pueden reducir para aprovechar al máximo el big data. Es útil cuando se trata de implementar e integrar tecnología y aplicaciones de big data. Cuando los investigadores buscan entre grandes cantidades de datos o evalúan tendencias en big data, este es un recurso invaluable. También hay numerosos documentos técnicos y casos disponibles para que los investigadores los vean en el sitio.
180. Estadísticas archivadas del gobierno nacional
Fundado en 2006, Archive-It es un servicio proporcionado por Internet Archive. Este servicio ayuda a organizaciones y empresas a crear colecciones digitales y, como resultado, ha tenido oportunidades de trabajar con organizaciones sin fines de lucro, colegios, universidades y gobiernos. Los investigadores pueden buscar en algunos de los diferentes archivos del sitio, como sitios web de la carrera de candidatos al Congreso de 2014, los Archivos del Estado de Alabama y el Archivo Web PLN de Información del Gobierno Canadiense. Este sitio es un tesoro de información para periodistas emprendedores.
Civic Commons tiene una página que enumera las diversas iniciativas gubernamentales de datos abiertos. Esta lista de recursos con capacidad de búsqueda está organizada por país, ciudad, región e incluso menciona los recursos puestos a disposición por organizaciones intergubernamentales. Para los periodistas, este sitio representa una forma más rápida de conocer qué gobiernos están participando en el Proyecto Datos Abiertos. Este sitio también otorga acceso a datos localizados que no necesariamente aparecerían en una simple búsqueda en Google.
182. Gobiernos mundiales guardianes
The Guardian es un nombre famoso en el mundo del periodismo por su reputación de noticias de última hora. Lo que menos gente se da cuenta es que el sitio tiene una sección que ofrece datos sobre gobiernos de todo el mundo. Hay artículos sobre el impacto de las cifras de personas sin hogar, debates sobre seguridad cibernética e incluso debates reflexivos sobre el papel que deben desempeñar los datos y las estadísticas en el clima político y social actual. La sección Gobierno Mundial de The Guardian es capaz de impulsar la discusión y encontrar ángulos para las historias.
183. Datos abiertos del gobierno (hub)
Este sitio pertenece a un grupo a través de Open Knowledge Foundation con el objetivo de alentar y apoyar el desarrollo continuo de datos gubernamentales abiertos. Aquí, los usuarios descubrirán enlaces a una de las listas más extensas de catálogos de datos abiertos disponibles. Entre los objetivos adicionales mencionados en el sitio, el grupo también busca encontrar información sobre políticas, mejores prácticas y pautas. Brinda a los periodistas un amplio acceso a más y mejor información.
184. Gobierno Abierto – Francia
Este sitio web es el hogar en línea del proyecto de datos abiertos ofrecido por el Gobierno de Francia. Es posible profundizar en los datos buscando en categorías como empleo, agricultura, educación, viajes y turismo. Estos son datos que permiten construir y desarrollar una comprensión más matizada de lo que realmente dicen los datos, al mismo tiempo que dejan espacio para comparaciones basadas en la información histórica. Básicamente, los periodistas tienen todas las razones para estar entusiasmados con la revisión de estos datos.
185. Universidad de Notre Dame
Este sitio almacena los datos de investigación disponibles a través del uso de SourceForge.net por parte de la Universidad de Notre Dame. Los datos se ofrecen a través de bases de datos relacionales. Los volcados de datos mensuales también permiten obtener una mejor comprensión del software de código abierto y sus aplicaciones. Para acceder a esta información, las solicitudes de acceso deben realizarse por escrito a través de correo electrónico. El problema, sin embargo, es que los investigadores académicos y académicos son los únicos elegibles para acceder a los datos.
186. Informes OVNI
El Centro Nacional de Informes de OVNIs tiene una base de datos en línea que detalla las experiencias de las personas con objetos voladores no identificados. Los investigadores pueden agilizar su búsqueda en la base de datos utilizando cualquiera de las cuatro categorías en la fecha, la forma del OVNI, la fecha de publicación e incluso por estado. Los ovnis son únicos porque nunca dejan de capturar la imaginación del público. Si ha habido encuentros recientes del tercer tipo cerca, este es el lugar para averiguar lo que la gente ha estado diciendo.
187. WikiLeaks
Notorio e infame en los medios debido a las controversias y lo que las filtraciones han revelado sobre el funcionamiento interno del gobierno y otras figuras famosas y poderosas de la sociedad, WikiLeaks tiene una reputación que lo precede. Aunque los volcados de datos rara vez se eliminan en silencio, nadie cuestiona la precisión de la información. Para los periodistas en busca de historias que despierten interés al instante, WikiLeaks es una fuente comprobada. Si nada más, será una lectura interesante.
El periódico ya es conocido como una excelente fuente de noticias de última hora y artículos de opinión, pero pocas personas saben que el Washington Post otorga acceso a los datos sin procesar que a menudo se mencionan en sus artículos. En la página de datos, los investigadores pueden encontrar datos en categorías como educación, censo, salud y seguridad, transporte y desarrollo, bases de datos históricas de la Copa Mundial e incluso números relacionados con el gobierno y la política. En pocas palabras, tener acceso a estos números ayuda a las personas a desarrollar una comprensión más concreta de los temas de las noticias.
189. Datos climáticos
Los datos climáticos son un conjunto de datos que proporciona información completa sobre la temperatura global. En el formato actual, los usuarios pueden ver toda la información climática importante a través de las cuadrículas y, al mismo tiempo, ver cuáles son los promedios. Para aquellos que buscan los datos complementarios, también es posible obtener acceso a la misma información para la tierra y el océano. Esta información se puede descargar, pero por conveniencia, también se puede ver directamente en el sitio.
190. Estructura de la proteína
Protein Structure es una fuente que busca examinar cómo se pueden usar las redes informáticas junto con la biología. La página alberga un repositorio con datos a los que se puede acceder a través de los enlaces proporcionados. De particular interés para los miembros de la comunidad de investigación es cómo el sitio incorpora varias ideas como el análisis de modelos y la biología ejecutable en su búsqueda de este objetivo. Para los periodistas, vale la pena visitar este sitio para observar el progreso y examinar los datos.
191. Analice los datos de la encuesta de forma gratuita
Con la ayuda de este sitio, los usuarios pueden tomar un curso de análisis de datos de encuestas sin tener que pagar por el privilegio. Analice los datos de la encuesta gratis con su tabla de contenido detallada, incluye secciones con títulos deportivos como Mapas y El arte de la encuesta: mantenimiento ponderado, Equilibrio de la confidencialidad del encuestado con precisión de estimación de varianza, Modelos de ecuaciones estructurales (SEM) y Datos de encuestas complejas. El sitio ofrece un excelente repaso para aquellos que anticipan manejar más datos estadísticos en el futuro.
192. Universidad de California en Los Ángeles
En el sitio wiki de UCLA, los investigadores encontrarán una serie de conjuntos de datos disponibles con fines de demostración. Hay muchos datos simulados y observados para elegir. Al usar estos recursos, es posible que las personas usen este recurso para descubrir datos climáticos, datos de población, datos biomédicos, datos de neuroimagen, datos del censo de EE. UU., datos electorales y datos económicos, entre muchas otras categorías. En última instancia, estos conjuntos de datos son un recurso del que muchas personas pueden beneficiarse.
En la página de su sitio, la Universidad de Toronto ofrece a los investigadores acceso a lo que llama Delve Datasets. Estas colecciones de datos fueron parte de un producto más grande diseñado con el propósito de hacer comparaciones entre los métodos de aprendizaje. En última instancia, esta información está ahí para el desarrollo y la evaluación de los diferentes enfoques del aprendizaje. En resumen, esta es una fuente sólida para los investigadores que desean comprender mejor cómo analizar y manejar conjuntos de datos.
194. Servicio de Conservación de Recursos Naturales
El Servicio de Conservación de Recursos Naturales tiene un sitio que se concentra en promover la conservación mientras ofrece información sobre los diferentes musgos, antocerotes, plantas vasculares, líquenes y hepáticas presentes en los Estados Unidos. Este sitio alberga una base de datos completa de plantas e imágenes de plantas que se pueden encontrar en el sitio para acompañar toneladas de información. Los investigadores pueden descargar la base de datos y encontrar toneladas de información sobre temas como cultivos alternativos. Esencialmente, este sitio web tiene todo lo que la gente necesita saber sobre las plantas.
195. Servicio de Investigación Agropecuaria
Como se puede deducir del nombre de la agencia, este servicio maneja las necesidades de investigación del Departamento de Agricultura de los Estados Unidos. Cada vez que se descubre un problema agrícola, esta es la parte del gobierno que probablemente ayudó a encontrar una solución. El sitio alberga una serie de conjuntos de datos a los que se puede acceder y descargar directamente. Los periodistas también pueden usar este sitio para encontrar las últimas noticias en relación con los problemas que afectan a la agricultura.
196. Biblioteca de imágenes de celdas
Este sitio ofrece una biblioteca pública que ofrece recursos, información y acceso a imágenes y animaciones que representan células y procesos celulares. La celda está diseñada con el proceso dual de investigación y educación en mente, la información aquí es casi siempre relevante durante las discusiones sobre salud pública y enfermedades. Los materiales provienen de una combinación de fuentes que incluyen publicaciones históricas y modernas. Para una explicación completa que simplifique los procesos biológicos complicados, los periodistas no pueden equivocarse con la Biblioteca de imágenes celulares.
197. Genómica completa
Este es el sitio de una empresa que se considera una parte establecida del espacio biotecnológico en el área de la secuenciación del genoma humano. Curiosamente, Complete Genomics ha puesto a disposición del público algunas de sus secuencias genómicas completas. En última instancia, esto ofrece todo tipo de información útil sobre el ADN y el genoma humano secuenciado. La única condición de este material es que los investigadores que utilicen esta información tengan cuidado de proporcionar a Complete Genomics las referencias adecuadas.
198. matriz expresa
Array Express es un repositorio que almacena información de los resultados de experimentos genómicos que requirieron cantidades masivas de secuenciación o procesamiento. En este sitio, los usuarios encontrarán los resultados de más de 70 000 experimentos junto con más de 2 millones de ensayos dentro de varios terabytes de almacenamiento de datos. Mejor aún, esta información es gratuita para su reutilización con fines de investigación. Este es un gran recurso para obtener toda la información más reciente sobre genómica y el progreso que se está logrando en el campo.
199. Codificar
La Enciclopedia de Elementos de ADN, o el Consorcio ENCODE, es el resultado de grupos de investigación de todo el mundo que trabajan en colaboración unos con otros. En última instancia, el objetivo es compilar una lista de todas las partes funcionales del genoma que incluya el examen detallado de los niveles de ARN, las proteínas, los elementos que regulan las células y la actividad de los genes. Hay datos que se pueden buscar, así como una enciclopedia que ofrece más información.
200. Conjunto de genomas
Ensemble Genomes es un sitio establecido en 2000 que se ocupa de los genomas de los vertebrados. A lo largo de los años, este recurso ha agregado información complementaria sobre metazoos de invertebrados, plantas, bacterias y hongos. Los datos sobre todos estos temas se pueden encontrar y acceder haciendo clic en los enlaces disponibles en el sitio. Este sitio tiene tutoriales, conjuntos de datos sobre todos los temas tratados y una colección de documentos para navegar. Todos estos factores hacen de Ensemble Genomes una fuente de datos fantástica para los periodistas.
201. Consorcio de ontología génica
Gene Ontology es un sitio que existe con el propósito expreso de encontrar una manera de representar la comprensión actual de cómo funcionan los genes por computadora. Tiene numerosas publicaciones, así como documentación adicional que la gente puede leer. Hay anotaciones alojadas directamente en el sitio. La buena noticia para los investigadores que desean observar más de cerca los números y los datos sin procesar es que hay archivos disponibles para descargar directamente en el sitio web.
202. Biblioteca de firmas celulares integradas basadas en red
El Centro LINCS de la Facultad de Medicina de Harvard existe con el propósito de ayudar a la comunidad científica y al público en general a aprender más sobre cómo reaccionan las células humanas cuando han sido perturbadas por fármacos. Utilizando la base de datos HMS LINCS y la herramienta de exploración de proyectos, los investigadores pueden encontrar publicaciones y resúmenes de proyectos, así como recursos generales. Los periodistas también pueden usar este sitio para obtener las últimas noticias e información que surge de esta investigación.
203. Proyecto de Diversidad del Genoma Humano
El Proyecto de Diversidad del Genoma Humano ha progresado mucho gracias a los esfuerzos del Centro del Genoma Humano de Stanford. El sitio tiene muestras que tienen miles de muestras y marcadores. Resulta que estos pueden descargarse y observarse y analizarse a fondo simplemente siguiendo los enlaces que se han proporcionado en la página. Este es un gran recurso para los periodistas que desean comprender la información que proviene de la comunidad investigadora.
204. Visor de datos JCB
JCB DataViewer permite a los interesados en lo que dice el Journal of Cell Biology ver los datos de imagen asociados con los artículos publicados allí. El sitio tiene una galería completa por la que las personas pueden desplazarse para ver los materiales. Además, los espectadores también tienen la opción de poder realizar un análisis más detallado de los datos a medida que examinan el sitio. En pocas palabras, este sitio es perfecto para comprender las referencias y cifras presentes en los artículos de la revista.
205. Portal de datos comunes de datos genómicos
El Portal de datos de GDC es una plataforma que está diseñada para ayudar a los investigadores y aquellos en el campo de la bioinformación a realizar investigaciones sobre el cáncer de manera más eficiente. Hay un archivo, una API, así como documentos disponibles para leer, etc. Acceder a este sitio significa poder ver la misma información que los investigadores del cáncer utilizan para realizar sus propias investigaciones. Aquí, los periodistas podrán encontrar todos los datos que buscan y algo más.
206. abierto
Opensp es un proyecto impulsado por la comunidad diseñado con el propósito de compartir genotipos. Las personas que han sido tipeadas con FamilyTreeDNA, 23andMe o deCODEme pueden cargar esa información en el sitio. El propósito de pedirle a la gente que haga esto es que el sitio pueda enfocarse en ver si se pueden encontrar conexiones entre genotipos y SNP, o polimorfismos de un solo nucleótido. Lo que es de interés único para los periodistas es que hay datos disponibles para que la gente los descargue y disfrute de verlos.
207. Guía de ruta
Pathguide es un sitio dedicado a proporcionar información sobre vías metabólicas y de señalización, así como sobre las interacciones entre proteínas a nivel molecular. Esta página alberga una lista de aproximadamente 697 recursos relacionados con el tema principal. Las bases de datos a las que se vinculan en este sitio son generalmente de libre acceso. La mayoría de las referencias proporcionadas en esta lista de recursos se centran principalmente en la interacción proteína a proteína. Este sitio es un recurso invaluable para los entusiastas de la biología.
208. RCSB PBB
Este es un sitio dedicado a informar a los académicos y al público en general sobre todo lo relacionado con los ácidos nucleicos y las proteínas. El banco de datos de proteínas RCSB ofrece acceso a varias herramientas diseñadas para hacer que este aspecto de la biología sea más comprensible, incluidas herramientas de visualización, visualización de estructuras en 3D y un archivo de búsqueda completo que se puede clasificar por categoría de organismo. Además, este sitio ofrece noticias actualizadas sobre todos los últimos desarrollos en este campo.
209. Consorcio de Genómica Psiquiátrica
El Consorcio de Genómica Psiquiátrica es el resultado de la colaboración entre investigadores y científicos de todo el mundo que trabajan en la investigación del componente genético de los trastornos psiquiátricos. En última instancia, este proyecto pudo producir 17 documentos principales y 31 documentos de desarrollo adicionales que ofrecen análisis y métodos secundarios con un único documento de referencia que surgió de todo. El Consorcio ofrece herramientas, descargas y acceso a los hallazgos a través del portal de acceso a datos previa solicitud.
210. pub quimica
PubChem es un nombre respetado en el campo de la investigación médica y biológica y lo ha sido durante mucho tiempo. Ofreciendo la capacidad de buscar estructuras, así como las bases de datos de Compuestos, Bioensayos y Sustancias, los investigadores no pueden equivocarse con este sitio. Además, hay millones de entradas presentes en cada una de estas bases de datos. Esta información se puede ver a través de herramientas como las herramientas de conformación 3D y las herramientas de Bioensayo. Los datos también están disponibles para su descarga.
211. CÓSMICO
Como sugiere el nombre, el Catálogo de mutaciones somáticas en el cáncer, o COSMIC, está dedicado a la crónica y exploración de los efectos de las mutaciones somáticas en el cáncer. El sitio permite realizar búsquedas en COSMIC clasificadas por tipo de cáncer, gen y mutación. Hay herramientas en COSMIC, como el navegador del genoma y el navegador del cáncer. Además, también hay datos sobre curación de genes, resistencia a los medicamentos, análisis de genomas, firmas mutacionales y curación de fusión de genes disponibles en el sitio para su descarga.
212. Genómica de la sensibilidad a los fármacos en el cáncer
La Genómica de la sensibilidad a los medicamentos en el cáncer se dedica a encontrar biomarcadores que puedan ayudar a los médicos a identificar el tipo de medicamento contra el cáncer al que es más probable que los pacientes respondan. Los periodistas pueden usar las pestañas de noticias para mantenerse actualizados sobre la presencia de nuevos datos o cambios en el sitio. Además, también hay una compilación de datos sobre líneas celulares, una base de datos que registra las características del cáncer e incluso una lista de compuestos disponibles para ver en el sitio.
213. Instituto Stowers de Investigación Médica
El sitio web del Stowers Institute for Medical Research ofrece a los miembros investigadores del público acceso gratuito a los datos que sus científicos, científicos investigadores y científicos genómicos han utilizado para sus publicaciones. Para el público en general, el instituto se esfuerza por señalar que el Repositorio de datos originales de Stowers suele ser de acceso gratuito. Dicho esto, algunos de los archivos más grandes de la base de datos pueden no ser accesibles directamente a través de Internet y pueden requerir arreglos adicionales.
214. Base de datos SSBD
La base de datos de sistemas Science of Biological Dynamics, generalmente denominada base de datos SSBD para abreviar, proporciona un conjunto de herramientas y recursos que se utilizarán con el fin de examinar imágenes microscópicas y evaluar datos biológicos cuantitativos. Las imágenes que se encuentran en este sitio provienen de una variedad de fuentes e incluyen objetos como células, moléculas individuales y núcleos de expresión génica. Dado que los datos de este sitio se obtienen a partir de simulación computacional y experimentos, los periodistas pueden estar seguros de que la información aquí se refina y actualiza constantemente.
215. Compartir genomas personales
El Proyecto Genoma Personal es un sitio que se enfoca en la creación de datos de salud, genoma y rasgos que están abiertos y disponibles para el público. Continuando en gran medida con el proyecto con la asistencia de personas que se han ofrecido como voluntarias para hacer pública su información genómica, este sitio ofrece al público de forma gratuita los datos que ha encontrado y adquirido con éxito. Dejando de lado la ciencia, este proyecto ofrece a los periodistas una mirada interesante a los efectos de crear un registro público de información del genoma personal.
216. Explorador del genoma de la UCSC
El USCS Genome Browser permite a las personas ver conjuntos de genomas. Además de la visualización en línea, el sitio también proporciona enlaces que se pueden usar para descargar las secuencias y anotaciones para esos mismos ensamblajes del genoma. Estos enlaces se dividen en las categorías de humanos, mamíferos, otros vertebrados, deuteróstomos, insectos, nematodos, otros genomas y otras descargas. Las herramientas y los directorios de este sitio también son gratuitos para uso personal y no comercial. Los periodistas pueden beneficiarse de la exhaustividad y la accesibilidad de esta información.
217. UniProt
Universal Protein Resource, conocido con el nombre de UniProt, es el lugar para obtener información sobre secuenciación y anotación de proteínas. A partir de la información proporcionada por tres bases de datos en UniProt Reference Clusters, UniProt Knowledgebase y UniProt Archive, este sitio está equipado con búsquedas de péptidos y grupos, entre otras características. Los periodistas pueden usar este sitio para verificar, descubrir y aprender más sobre nuevos descubrimientos en el área de secuenciación y anotación de proteínas.
218. Datos del índice climático de los actuarios
El índice climático de actuarios, también llamado ACI para abreviar, brinda al público en general y a los tomadores de decisiones información sobre las tendencias climáticas y el efecto del cambio climático en Canadá y los EE. UU. Los investigadores pueden examinar la información proporcionada por esta herramienta educativa para encontrar y descubrir cambios masivos en el mar y el clima. Es posible acotar la búsqueda por regiones y componentes. Este sitio tiene décadas de datos a su disposición y periódicamente actualiza su información trimestralmente.
219. Centro Meteorológico de Aviación
El Aviation Weather Center proporciona información precisa, oportuna y actualizada sobre el clima en la que puede confiar el sistema del espacio aéreo. En este sitio, los usuarios pueden ver los diversos gráficos, pronósticos y observaciones sobre el clima enmarcados de una manera que los aviadores pueden apreciar. Es posible ver la información proporcionada por las fuentes de datos del sitio en tiempo real a través de la salida .csv o XML. Los investigadores pueden manipular y observar los números sin procesar más de cerca a través de esta opción de descarga.
220. Unidad de Investigación Climática
El sitio web de la Unidad de Investigación Climática está allí con el propósito expreso de realizar investigaciones sobre los efectos del cambio climático en el pasado, estudiar las causas y encontrar soluciones a los problemas del cambio climático en el presente. Aquí, las personas pueden leer sobre los resultados de la investigación, obtener una visión general del tema a través de las hojas de información, leer publicaciones e incluso acceder a los datos sin procesar. Los periodistas que buscan conjuntos de datos meteorológicos sin procesar están de enhorabuena con este recurso.
221. Conjunto de datos y evaluación del clima europeo
En el sitio web de European Climate Assessment & Dataset, el público puede descubrir información sobre cambios extremos en el clima o el tiempo. Los investigadores tienen la opción de usar la herramienta de investigación del proyecto, llamada KNMI Climate Explorer, para verificar datos, examinar pronósticos estacionales e incluso observar más de cerca los efectos de El Niño, entre otras aplicaciones. Dado que este conjunto de datos se actualiza diariamente, los periodistas que utilicen esta fuente serán los primeros en enterarse de cualquier señal de cambio climático extremo.
222. Servicios de búsqueda de imágenes globales
Global Imagery Browse Services, GIBS para abreviar, es una parte esencial de EOSDIS en su papel como proveedor de servicios de imágenes que responden y se basan en los estándares de la comunidad. Dicho de otra manera, GIBS permite que la gente normal interactúe con imágenes satelitales tomadas desde prácticamente cualquier parte del mundo en alta definición. Dado que EOSDIS GIBS está disponible a través de los datos de ciencias de la tierra de la NASA, es más fácil que nunca para los periodistas e investigadores aprender más sobre el mundo en tiempo real.
223. Clima y ecosistema de Bering
Operando bajo la Administración Nacional Oceánica y Atmosférica del Gobierno de los Estados Unidos, este sitio web les dice a los periodistas e investigadores todo lo que podrían desear saber sobre cómo el clima y el ecosistema del Mar de Bering están reaccionando a los cambios que han ocurrido en el Ártico. Aquí, es posible leer ensayos, revisar proyecciones y usar la herramienta de datos en línea para ver cómo están funcionando varios índices climáticos, datos biológicos, atmosféricos, oceánicos y de vida silvestre en el mar de Bering.
224. NCEI
El NCEI, o Centros Nacionales de Información Ambiental, es el resultado final de la fusión de los tres centros de datos de la Administración Nacional Oceánica y Atmosférica. Esta página alberga una serie de enlaces divididos en 22 categorías que vincularán a los usuarios a diferentes recursos, páginas de interés y conjuntos de datos climáticos y meteorológicos. Los periodistas que buscan información sobre el clima, las tormentas, las precipitaciones y una serie de otras inquietudes meteorológicas probablemente encontrarán lo que buscan aquí.
225. Laboratorio de Investigación del Sistema Terrestre
La División de Monitoreo Global de la Administración Nacional Oceánica y Atmosférica proporciona información sobre las tendencias a largo plazo de las fuerzas del cambio climático en la tierra a través de su monitoreo de métricas atmosféricas clave. Entre estos estarían, a modo de ejemplo, el monóxido de carbono, el metano, el óxido nitroso y el dióxido de carbono. Estas métricas se utilizan luego para medir cosas como el agotamiento del ozono a largo plazo, las fuentes y los niveles de dióxido de carbono, así como los sumideros. Este es un recurso sobre el cambio climático que los periodistas pueden usar.
226. WorldClim – Datos climáticos globales
¿Alguna vez quiso una mejor manera de visualizar los datos climáticos? WorldClim es un proveedor de software de datos gratuitos que luego se pueden aplicar al modelado espacial, así como a la creación de mapas. La versión actual de este software gratuito solo se puede aplicar al clima actual, mientras que la versión anterior permite acceder a datos climáticos del pasado y del presente y también permite a los usuarios ver el estado de las predicciones climáticas futuras. Los periodistas pueden simplemente seguir el enlace y descargar el software.
227. Laboratorio de Descubrimiento del Conocimiento
El Knowledge Discovery Laboratory es un sitio dedicado al desarrollo de tecnologías innovadoras, los conceptos básicos del aprendizaje automático y la aplicación de ese conocimiento en áreas prácticas como la ciencia de redes, la detección de fraudes y el análisis de datos científicos. El sitio alberga un conjunto de datos bastante considerable en el DBLP con 1,2 millones de objetos y 2,48 millones de enlaces incluidos en el conjunto. Para los investigadores interesados en los objetivos del Knowledge Discovery Laboratory, este conjunto de datos es un excelente recurso.
228. Desafío de implementación de DIMACS
El sitio web del 9º Desafío de Implementación trata de ayudar a los investigadores a aprender cómo resolver problemas de ruta más corta. Para los creadores, el sitio se creó con dos objetivos en mente. Primero, encontrar las mejores soluciones reproducibles. Y dos, facilitar que los investigadores colaboren y descubran soluciones más efectivas. Los investigadores que estén interesados en ver cuánto progreso se logra con esto pueden revisar los documentos y los conjuntos de datos en el sitio.
229. Repositorio de red
El repositorio de red es un sitio donde se almacenan datos científicos con la adición de herramientas visuales interactivas a las que los usuarios pueden acceder y analizar. Este sitio tiene la doble distinción de ser el primer repositorio de este tipo y también el más grande en la web. Utilizar datos gráficos e imágenes intuitivas y visualmente atractivas, hacer comparaciones y encontrar nuevas formas de contextualizar los datos es mucho más fácil. Los periodistas pueden usar esta fuente para encontrar historias dentro de los datos científicos.
230. Conjuntos de datos de Pajek
Pajek Datasets es una página que proporciona un conjunto de datos que aborda las interacciones entre las proteínas que se encuentran en la levadura en ciernes. Después de ofrecer una breve explicación de fondo sobre el impacto de encontrar nuevos métodos para detectar interacciones junto con las razones por las que es esencial poder discernir la importancia de varias interacciones proteína a proteína, el sitio vincula a los espectadores directamente a un conjunto de datos que está disponible para descargar. Para obtener más información, los investigadores pueden hacer clic en el enlace en la parte inferior para leer el artículo publicado sobre el tema.
231. Datos de la red Mejn
Este sitio busca compartir enlaces a los conjuntos de datos de red que el propietario de la web ha utilizado y compilado. Los temas de los conjuntos de datos van desde fútbol americano universitario, blogs políticos y libros sobre política estadounidense, hasta redes sociales, Los Miserables y colaboraciones de teorías de alta energía. Las personas interesadas en explorar estos tendrán muchos temas de conjuntos de datos de interés para elegir. Además, los datos son de uso gratuito siempre que haya referencias.
232. La base gráfica de Stanford
Stanford GraphBase es el nombre que Donald Knuth de Stanford le ha dado a un conjunto de conjuntos de datos y programas. Cuando se usan en combinación, estos programas y conjuntos de datos pueden manipular y generar gráficos y redes. En este sitio, los materiales requeridos están disponibles para su descarga a través de los enlaces. En estos archivos, los investigadores encontrarán datos de puntajes de fútbol, datos de diccionarios, datos relacionados con la reconstrucción de la Mona Lisa y muchos otros.
233. SuiteSparse Matrix Collection
Anteriormente conocida como la colección de matriz escasa de la Universidad de Florida, la colección de matriz SuiteSparse es una colección de matrices que tienen implicaciones en la vida real. Según el sitio, esta colección en particular se usa con mayor frecuencia para el álgebra lineal numérica en el desarrollo y refinamiento de algoritmos de matriz dispersa. A los usuarios suele gustarles la colección por su utilidad para ejecutar y probar los resultados de los experimentos. Los conjuntos de datos y los puntos de referencia de la matriz están disponibles para descargar directamente en el sitio.
234. Conjuntos de datos gráficos
Este es un conjunto de conjuntos de datos que los creadores de esta página web creían que eran relacionales o capaces de traducirse bien a una representación gráfica. Graph Datasets ofrece conjuntos de datos como los datos del Predictive Toxicology Challenge, los datos de IMDb, los datos de mutagénesis, los datos de MovieLens, el filtrado colaborativo y los datos de proteínas para los investigadores que desean aprender a trabajar con los números sin procesar. Los archivos están disponibles en esta página y están disponibles principalmente para descargar en formato XML.
235. Noticias de Big Data
Big Data News es un sitio que se enfoca en big data y los fundamentos de la ciencia de datos. Este sitio alberga las últimas noticias e incluye una discusión sobre el aprendizaje profundo y la inteligencia artificial. Además, Big Data News también alberga un conjunto de datos masivo que contiene un total de aproximadamente 3500 millones de páginas web. Todos estos están separados por niveles que se denominan gráfico de nivel de página, gráfico de nivel de subdominio, gráfico de subdominio de primer nivel y gráfico de dominio de nivel de pago, respectivamente.
236. Centro de Investigación de Sistemas y Redes Complejas
CNetS, o el Centro de Investigación de Redes y Sistemas Complejos, que opera bajo el paraguas del Instituto de Ciencias de Redes de la Universidad de Indiana y la Escuela de Informática y Computación. El sitio pretende ser un recurso en los campos de la ciencia de datos, la ciencia social computacional y redes y sistemas complejos con información sobre minería y patrones de tráfico en línea. Además, CNetS también alberga un conjunto de datos que contiene aproximadamente 53 500 millones de solicitudes de red realizadas por usuarios de la Universidad de Indiana.
237. Explorador OONI
OONI Explorer, parte del Observatorio Abierto de Interferencia de Red, es un proyecto dedicado a proporcionar software libre y de código abierto. Es posible que los usuarios utilicen el software para intentar bloquear sitios web y aplicaciones de mensajería, entre otras aplicaciones. De particular interés para las personas interesadas en esta tecnología, es la disponibilidad de acceso gratuito a los datos sin procesar que ha recopilado OONI. Simplemente ingrese la información en OONI Explorer e interactúe con los datos desde allí.
238. Desafíos en el aprendizaje automático
Challenges in Machine Learning se dedica a la investigación y desarrollo del aprendizaje automático. En este sitio, los lectores encontrarán enlaces a software, libros, desafíos de aprendizaje automático, así como notificaciones de próximos talleres. El sitio incluso proporciona enlaces a desafíos que permiten envíos posteriores a la fecha. Para los periodistas que estén interesados en ver si el aprendizaje automático puede realizar tareas como la predicción financiera o la clasificación de páginas web, este es un sitio que vale la pena visitar.
239. DatosX
Actualmente trabajando bajo el paraguas de CrowdANALYTIX, DataX es la parte de la máquina de una iniciativa impulsada por la comunidad que aprovecha el poder del colectivo para crear aplicaciones personalizadas de inteligencia artificial, aprendizaje automático y programación neurolingüística. El papel de DataX en el proceso es el mantenimiento y la implementación, que a su vez sirven para que estas soluciones sean escalables. Para los periodistas que tienen toneladas de texto, video y datos para clasificar, los bots disponibles a través de CrowdANALYTIX y DataX pueden reducir los tiempos de investigación a la mitad.
240. Datos controlados
Driven Data combina el crowdsourcing con la ciencia de datos de una manera que casi ningún otro sitio lo hace. Al enfatizar su función de brindar asistencia a las organizaciones que enfrentan diferentes desafíos sociales, este sitio ofrece ayuda al poner a trabajar a su importante comunidad de ciencia de datos para crear modelos estadísticos que resuelvan preguntas predictivas. Driven Data parece funcionar principalmente con organizaciones sin fines de lucro, pero es potencialmente útil para cualquier persona que tenga datos sin procesar que necesiten refinarse. Los periodistas pueden beneficiarse al tener en cuenta esta fuente.
241. Grandes datos abiertos
Dandelion API es una aplicación que maneja el análisis de texto semántico para big data. Lo que esto significa para las personas que tienen datos que requieren procesamiento es que este programa tomará texto desorganizado y encontrará una manera de ponerlo en contexto. Los periodistas que analizan muchos documentos definitivamente pueden beneficiarse de esa capacidad. Dandelion API también tiene Open Big Data en las categorías de Milán, Trento y Europa. Aunque esta API es de pago, hay una cantidad diaria de texto que se puede analizar de forma gratuita.
242. Modelos de la Tierra
Earth Models se enfoca en compartir y almacenar software y conjuntos de datos en relación con la tierra. Las herramientas de modelado mencionadas en el sitio incluyen software y procesamiento de simulación, así como datos virtuales que se basan en gran medida en áreas específicas de estudio como la tectónica y la sismología. Los periodistas e investigadores que deseen perfeccionar sus conocimientos sobre el tema pueden utilizar las publicaciones y artículos de este sitio para hacerlo antes de sumergirse en las herramientas de modelado y visualización.
243. Centro de Aplicaciones y Datos Socioeconómicos (SEDAC)
El Centro de Aplicaciones y Datos Socioeconómicos, o SEDAC, es uno de los centros de datos asociados con el sistema EOSDIS de la NASA. En este sitio, los lectores encontrarán conjuntos de datos que ofrecen cifras sobre el cambio climático o información demográfica cuadriculada. Los conjuntos de datos también se pueden buscar por temas como Gobernanza, Agricultura, Uso de la tierra, Salud, Conservación y Clima, Agua, Detección remota y Pobreza. Hay mapas, galerías, guías que brindan más contexto a los datos y recursos y herramientas adicionales a los que los investigadores también pueden acceder en el sitio.
244. Portal AODN
El Portal AODN, un sitio de la Red Australiana de Datos Oceánicos, es un sitio que ofrece acceso a la ciencia climática y los datos marinos de Australia. Los investigadores que accedan a esta información también tendrán acceso a los datos y metadatos de IMOS, que es un marco de investigación con el apoyo de múltiples instituciones, incluido el gobierno australiano. Los investigadores que opten por aprovechar el Portal AODN pueden esperar recibir una excelente entrega de los datos oceánicos en una interfaz intuitiva.
245. sistema operativo planeta
Planet OS ofrece un marco de big data con énfasis en energía renovable. Esta elección de nicho, junto con la competencia del sitio, lo ha hecho popular entre las empresas de energía que buscan nuevas formas de visualizar y contextualizar sus datos. Además, el sitio también tiene lo que se llama el presente DataHub, donde alberga una colección sustancial de más de 2000 conjuntos de datos. Estos conjuntos de datos incluyen datos abiertos a través de la NASA y Copernicus y los datos a menudo se actualizan periódicamente.
El Smithsonian ha sido durante mucho tiempo un nombre académico respetado y apreciado en todo el mundo por su compromiso con la investigación y la historia. En algunos aspectos, es natural que el Smithsonian tenga un sitio web que ofrezca la mejor información en línea sobre la investigación de volcanes. El sitio publica informes, enlaces de investigación y bases de datos que incluyen búsquedas estrechas de volcanes, erupciones, emisiones y deformaciones para acompañar la lista de volcanes del Holoceno y la hoja de cálculo. Los periodistas no necesitarán otra fuente sobre la actividad volcánica.
El Catálogo de Terremotos, actualizado y mantenido por el Programa de Peligros de Terremotos del gobierno de EE. UU., permite a los investigadores ver cuándo y dónde ocurrió un terremoto por última vez. Mientras que los resultados de la búsqueda están limitados a 20.000, la búsqueda del catálogo es capaz de filtrar los resultados por magnitud, fecha y hora, e incluso por región geográfica. Este nivel de flexibilidad hace que este recurso sea particularmente útil para los periodistas que están cubriendo un desastre natural o un terremoto local y están buscando información de antecedentes.
248. Asociación Económica Americana
La Asociación Económica Estadounidense proporciona a los investigadores datos sobre datos macroeconómicos de EE. UU. y otros países del mundo. Este sitio no parece producir datos económicos tanto como selecciona una breve lista de los más confiables. Sin embargo, a la luz de los muchos sitios que ofrecen información económica en Internet, este es un recurso que los periodistas pueden esperar que tenga credibilidad. Simplemente vaya al sitio y haga clic en las categorías de datos económicos correspondientes.
249. Estadísticas históricas.org
Historicalstatistics.org es un sitio increíblemente útil para encontrar el tipo de información económica que presenta un contraste interesante con el presente. Por ejemplo, el convertidor de moneda histórico del sitio permite a los investigadores averiguar cuánto podría comprar hoy una persona con $10 USD en 1923. También alberga publicaciones y documentos que hacen preguntas sobre las métricas utilizadas en el campo de la historia económica junto con índices de precios e información sobre la oferta monetaria que se puede filtrar por país.
250. DB Nomics
¿Qué pasaría si se pudiera acceder y buscar todos los datos económicos públicos en Internet desde una única plataforma navegable? Db.nomics es un agregador de bases de datos económicas que busca hacer exactamente eso. Los datos están disponibles en formatos como HTML, JSON y CSV y se actualizan automáticamente, mientras que las revisiones anteriores se archivan en consecuencia. Las fuentes económicas incluyen la Reserva Federal, la Oficina de Análisis Económico, el Fondo Monetario Internacional y otros. Los investigadores que buscan datos económicos confiables no pueden equivocarse con Db.nomics.
251. Eje Conjunto de Deuda Externa (JEDH)
Desarrollado a través del trabajo combinado del Banco de Pagos Internacionales, la Organización para la Cooperación y el Desarrollo Económicos (OCDE), el Fondo Monetario Internacional y el Banco Mundial, el Centro Conjunto de Deuda Externa pone a disposición información sobre datos de deuda y acreedores y deudores internacionales. el público. Los periodistas que investigan las finanzas de diferentes países y tratan de obtener una comprensión más profunda del panorama financiero internacional encontrarán prácticamente todo lo que quieren saber aquí.
252. Datos de comercio internacional
Junto con el aporte completo de un experto económico líder en Jon Haveman, esta página sobre datos de comercio internacional alberga datos que se pueden descargar y analizar más a fondo. Los conjuntos de datos incluyen datos arancelarios, tablas Penn World, servicios públicos, datos de importación, productividad de fabricación, clasificaciones de bienes, códigos de diferenciación de productos Rauch, datos NBER, la encuesta de flujo de productos básicos de 1997, comercio e inmigración y el modelo de gravedad útil. UNIX es el sistema operativo utilizado para compilarlos, pero el sitio señala que las PC también deberían tener acceso a los datos.
253. Empresas Abiertas
En OpenCorporates los investigadores tienen el lujo de buscar y encontrar información en una de las mayores bases de datos abiertas de empresas de todo el mundo. Luego, esta información es utilizada por diferentes grupos en todo el mundo, como bancos, investigadores, ONG y periodistas en un esfuerzo por obtener inteligencia e información. Los periodistas tienen la ventaja añadida de poder acceder a los datos en tiempo real con la ayuda de la API de OpenCorproates, así como a través de los datos básicos masivos u otros conjuntos de datos básicos.
Our World in Data toma información de varias fuentes en una variedad de áreas y presenta datos cuantificados sobre ella. Desde números sobre la participación de las mujeres en la fuerza laboral hasta información sobre la percepción general de la corrupción en el sector público y la desigualdad de ingresos a nivel mundial, si el tema se puede discutir en términos de datos, este sitio web podría tener una entrada para ello. Los periodistas pueden usar esta fuente para encontrar estadísticas y números relacionados con temas sociales.
255. Ciencia Po
Sciences Po, o como se le conoce más comúnmente, el Instituto de Estudios Políticos es una escuela que tiene una influencia innegable en las ciencias sociales. En este caso, la página de Thierry Mayer incluye archivos de datos que presentan datos de regresiones de conflictos militares y de gravedad de "Make Trade Not War", así como conjuntos de datos sobre los potenciales del mercado, entre otros. Los periodistas que busquen comprender mejor las conclusiones alcanzadas en las revistas académicas descubrirán mucha información mientras navegan por este sitio.
256. Centro de Datos Internacionales
Desde su debut en 1999, el Centro de Datos Internacionales se ha dedicado a su misión de recopilar, crear, mejorar y distribuir datos económicos internacionales tanto fuera de línea como en línea. En el sitio web, los lectores pueden acceder a información como datos arancelarios de EE. UU., importaciones y exportaciones mundiales y de EE. UU., e incluso información de Penn World Table. Con esta información disponible para el público para la educación y la investigación, los periodistas pueden acceder y utilizar estos datos de forma gratuita.
257. Observatorio de Complejidad Económica
El Observatorio de Complejidad Económica, comúnmente conocido como OEC, permite a investigadores, estudiantes, economistas y cualquier otra persona visualizar datos de comercio internacional. Con sus temas llamativos y su interfaz interactiva, este sitio brinda a los investigadores una oportunidad legítima de explorar información sobre comercio internacional de formas que nunca antes se habían visto. Para los periodistas a los que les gusta poder ver cómo los datos económicos cobran vida mientras los buscan, el OEC es un recurso invaluable.
258. Datos del cuadro de mando de la universidad
La educación superior es un tema candente en muchos círculos con estudiantes y familias que desean saber cómo se comparan las escuelas y qué tan bien están aprendiendo los estudiantes. A través de los datos de College Scorecard, el Departamento de Educación de los EE. UU. brinda a los educadores y estudiantes toda esta información y más. Estos números cubren de 1996 a 2016 e incluyen datos actuales, datos de tarjetas de puntuación y ganancias posteriores a la escuela, e información nueva del Sistema Nacional de Datos de Préstamos para Estudiantes. Es una fuente de educación postsecundaria actualizada que los periodistas deben estar seguros de utilizar.
259. Conjunto de datos sobre energía de edificios comerciales
Como un conjunto de datos que se ocupa principalmente de la energía, COMBED tiene un reclamo automático de singularidad. Agregue el hecho de que sus datos se renuevan varias veces por minuto mientras provienen de un edificio comercial, y queda claro que este conjunto de datos es único. Para los periodistas, esta información es increíblemente útil cuando preparan un artículo sobre el consumo de energía. Acceder a los datos de COMBED es tan fácil como descargar y abrir una hoja de cálculo de Excel.
260. Conjunto de datos DRED
La parte DRED de la base de datos DRED significa Conjunto de datos de energía residencial holandés. Como sugiere el título, estos datos miden y estudian cuánta energía consumirá un solo hogar holandés. El ambiente, la ocupación, la electricidad y la información general del hogar se monitorearon en este conjunto de datos desde el 5 de julio de 2015 hasta el 5 de diciembre de 2015. Cualquier periodista que investigue el consumo de energía se beneficiaría al consultar los números sin procesar proporcionados aquí. Las instrucciones para descargar los datos en CSV se pueden encontrar directamente en el sitio web.
ECO, siglas de Consumo y Ocupación de Electricidad, es un proyecto operado y administrado por el Grupo de Sistemas Distribuidos. La premisa de este proyecto hizo que los investigadores monitorearan las cargas y detectaran ocupaciones en seis hogares suizos en el transcurso de 8 meses. Este sitio ofrece acceso a esa información, así como instrucciones y enlaces a publicaciones relacionadas. Gracias al tablero visualmente interactivo del sitio, los periodistas no deberían tener problemas para traducir la investigación en algo atractivo.
262. Conjunto de datos indio para agua y energía ambiental
IAWE, que significa Indian Dataset for Ambient Water and Energy, se creó con el objetivo de monitorear el uso de energía de un hogar de New Dehli con mediciones de electricidad de los electrodomésticos, el medidor de electricidad y el panel de circuitos. Debido a interrupciones, diferencias en el suministro de agua, caídas de paquetes y fluctuaciones de voltaje, el iAWE se topó con problemas que eran exclusivos del seguimiento del uso de energía en la India. Estos son datos increíblemente útiles para que los periodistas los tengan al discutir los patrones de uso de energía.
263. Electricidad a nivel de electrodomésticos del Reino Unido
UK Domestic Appliance-Level Electricity, o UK-DALE, es el nombre que se le da a un conjunto de datos que monitorea y registra cuánta energía se demanda en un grupo de cinco hogares. Cada seis segundos, UK-DALE mide la demanda tanto de la red eléctrica principal como de los electrodomésticos individuales de la casa. Los periodistas interesados en ver cómo los hogares del Reino Unido utilizan la energía definitivamente pueden utilizar UK-DALE. Los datos son accesibles y hay un documento que describe el sistema disponible para su lectura.
264. ArcGIS
ArcGIS Hub es una plataforma que las organizaciones y las personas pueden usar para lograr objetivos a través de iniciativas en todo el sitio. Con plantillas de página, guías paso a paso y ejemplos disponibles para ver, este sitio es un excelente recurso para los ambiciosos promotores sociales. Mientras tanto, la información disponible en la pestaña Datos abiertos alberga cientos de conjuntos de datos solo en la categoría "Desastre". Ya sea que los periodistas estén investigando datos o contribuyendo con ellos, ArcGIS Hub es útil en más de un sentido.
265. SIG de Cambridge
Cambridge GIS es el repositorio de datos abiertos de la ciudad de Cambridge, Massachusetts. Con la excepción de los archivos que son demasiado grandes para descargarlos a través de este repositorio de GitHub, la mayoría de los conjuntos de datos de la ciudad se pueden encontrar en esta página. Los conjuntos de datos individuales disponibles aquí incluyen distritos comerciales, servidumbres, distritos de zonificación, resultados del censo, cementerios y otros puntos de referencia y características que pueden cuantificarse mediante datos. Un periodista que busca información local encontrará todo lo que busca y más en este sitio.
266. Geo-Wiki.org
Como recurso, Geo-Wiki es un sitio dedicado a lo que denomina el "movimiento de ciencia ciudadana". Aquí, se alienta a los ciudadanos a intentar monitorear el medio ambiente. Los investigadores pueden encontrar las últimas noticias en la barra lateral junto con los nombres de las publicaciones y las descargas gratuitas de conjuntos de datos y software. Las herramientas que el sitio hace accesibles incluyen mapas, carga de datos personales, validaciones y hackatones que se pueden descargar en formato Excel y archivos zip.
267. OpenStreetMap
Los extractos de datos de OpenStreetMap provienen del proyecto OpenStreetMap, el intento en línea en curso de crear un mapa del mundo a través de las ediciones y los esfuerzos de la comunidad global de usuarios. Para comenzar con esta fuente de datos, todo lo que los editores de contenido deben hacer es elegir su continente preferido y luego encontrar su país preferido después de ese punto. La descarga de Geofabrik GmbH es gratuita y, por regla general, los datos se actualizan diariamente.
Operado y mantenido por el Departamento de Seguridad Nacional, HIFLD, para datos de nivel básico de infraestructura nacional, coloca los datos geoespaciales en el dominio público. Estos datos se distribuyen con el propósito expreso de brindar apoyo e información con fines de investigación y preparación en la comunidad. Estos datos se pueden descargar en Shapefile y CSV y también se pueden ver en la web. Para los editores, HIFLD Open Data hace que los datos geoespaciales sean más visuales y atractivos que nunca.
269. Direcciones abiertas
OpenAddresses se especializa en infraestructura y recopilación de direcciones. Impulsado en gran medida por la fuerza de los esfuerzos de la comunidad, este sitio utiliza GitHub como su plataforma de desarrollo. Aquí, las personas pueden colocar direcciones en un mapa después de agregarlo a la base de datos o pueden tomar los datos y comenzar a geocodificar directamente de inmediato. Con todos los datos y direcciones abiertos y que requieren mera atribución, las actualizaciones periódicas de datos y el potencial para los avances de geocodificación hacen de OpenAddresses un proyecto muy interesante.
Open Data LMU depende en gran medida de los datos de OpenStreetMap para ayudar en el desarrollo del Fast Reverse Geocoder. Lo que esto significa es que la aplicación es capaz de tomar rápidamente una ubicación en un mapa y encontrar una dirección completa basada en ese punto. Esto también podría aplicarse potencialmente a los vecindarios y condados. Esta página web alberga una serie de enlaces relacionados con la aplicación que incluyen código fuente, conjuntos de datos y tablas de búsqueda y resoluciones de OpenStreetMap.
271. Explorador de datos ambientales
Con Environmental Data Explorer, los periodistas, investigadores y estudiantes pueden descargar y explorar los mismos conjuntos de datos que utiliza el Programa de las Naciones Unidas para el Medio Ambiente junto con sus organizaciones afiliadas y socios. Las búsquedas pueden reducirse por región y realizarse utilizando cualquiera de los 500 filtros o todos ellos. Además, los conjuntos de datos incluyen categorías como salud, PIB, clima, emisiones y agua dulce que se pueden ver directamente en el sitio, ya sea en forma de gráfico, tabla o mapa.
272. Grupo del Banco Africano de Desarrollo
El sitio del Grupo del Banco Africano de Desarrollo es la primera parada de un periodista cuando busca información estadística e indicadores relacionados con el continente africano. Los usuarios que se desplazan por el catálogo de datos pueden filtrar conjuntos de datos por fuente, tema y región. Para cualquiera que esté buscando un conocimiento más profundo del tema en cuestión, el sitio también ofrece enlaces a una impresionante lista de publicaciones que incluyen títulos como African Economic Outlook y African Statistical Yearbook.
273. Datos comunes genómicos (GDC)
Genomic Data Commons del NCI alberga uno de los repositorios de datos sobre el cáncer más completos de la web que se centra en el área de los estudios genómicos del cáncer. El portal de datos de este sitio alberga miles de casos y cubre 38 tipos de enfermedades para acompañar 39 proyectos y es de acceso gratuito. Dado que los envíos de datos son realizados principalmente por instituciones e investigadores, la precisión de esta información la convierte en una fuente de datos ideal para que los periodistas la tengan en el bolsillo trasero.
274. Bases de datos de PhysioBank
Las bases de datos de PhysioBank ponen los datos fisiológicos a disposición de las personas a través del dominio público. Estas bases de datos se dividen en dos categorías más grandes en forma de onda y clínica. Entre las subcategorías de formas de onda hay imágenes, bases de datos de intervalos entre latidos, bases de datos sintéticas, de marcha y equilibrio, ECG y de parámetros múltiples. Una muestra de la información pura que surge de esto incluye datos sobre signos vitales junto a la cama, saturación de oxígeno e incluso enfermedades cardiovasculares. Los periodistas y las personas que investigan el cuerpo humano pueden encontrar información aquí.
275. Base de datos de cobertura de Medicare
La base de datos de cobertura de Medicare, mantenida por los Centros de Servicios de Medicare y Medicaid a través del Departamento de Salud y Servicios Humanos, ofrece a los investigadores acceso completo a una tonelada de información sobre servicios médicos. Hay información sobre condiciones crónicas, gasto en medicamentos, plantillas clínicas electrónicas, el sistema de cobro de deudas y subvenciones para investigación y demostración para leer sobre esto. Para datos tomados directamente de la fuente, este es el sitio en línea más completo y completo de su tipo.
Contenido de nuestros socios
276. Abrir datos de pagos
Cuando la mayoría de las personas van al médico, por lo general no se sientan a pensar si su médico de atención primaria se está beneficiando financieramente o no después de trabajar con los fabricantes de atención médica. Open Payments informa al público sobre cualquier comida, investigación, obsequio, honorarios por conferencias y gastos de viaje que el médico o el hospital haya recibido de las empresas. Los periodistas que buscan una historia contundente pueden usar el explorador de datos para ver la información o hacer clic en la pestaña para descargar los datos directamente.
277. FlickrLogos
Está parcialmente escrito en el nombre, pero FlickrLogos se refiere a un conjunto de datos que consta de logotipos de empresas que han sido fotografiados en una variedad de posiciones diferentes. Mantenida por el Laboratorio de Computación Multimedia y Visión por Computador de la Universidad de Augsburgo, esta colección se compiló originalmente con la intención de entrenar a las computadoras para que reconocieran el logotipo y el texto. Para mantenerse al tanto de cualquier progreso realizado con este programa de interés periodístico, no está de más descargar este conjunto de datos y ver de qué se trata.
278. ImageNet
ImageNet es una base de datos llena de imágenes que han sido organizadas por WordNet. Hay desafíos anuales en el sitio que se pueden ver incluso después del cierre y se centran en la creación de algoritmos que pueden realizar tareas específicas. ImageNet también alberga numerosas publicaciones, citas y diapositivas. Los editores de contenido orientados a la tecnología tendrían todas las razones para usar la opción del explorador para dar sentido a la estructura de WordNet, así como al mapa de la nube.
279. Conjunto de datos de perros de Stanford
El conjunto de datos de Stanford Dogs contiene toneladas de fotografías e imágenes de diferentes razas de perros. Con 120 razas diferentes de perros incluidas junto con más de 20 000 imágenes individuales, esta base de datos impulsada por ImageNet brinda a los investigadores muchas imágenes con las que trabajar mientras enseña a las máquinas cómo reconocer cada raza de perro. En el sitio, se puede hacer clic en los enlaces a diferentes publicaciones que analizan el uso de conjuntos de datos para enseñar a las computadoras sobre el reconocimiento de imágenes y leer junto con la descarga del conjunto de datos.
280. Base de datos SUN
La base de datos SUN es el sitio de un proyecto elaborado para que la comunidad de investigación avance en áreas como la visión y los gráficos por computadora, la minería de datos, el aprendizaje automático y la neurociencia, entre otras. Con más de 131.000 imágenes y casi 4.000 categorías de objetos en sus índices, este sitio es tan completo como parece. Para los editores que estén interesados en esta base de datos y en lo que los investigadores han podido hacer mientras la usaban, esta es una fuente de datos que vale la pena explorar.
281. El conjunto de datos de mascotas Oxford-IIIT
El conjunto de datos de mascotas Oxford-IIIT es un sitio que actúa como complemento de un documento que se publicó en la Conferencia IEEE de 2012 sobre visión artificial y reconocimiento de patrones y alberga el conjunto de datos original que se utilizó para los fines del documento. Estas imágenes se han organizado en aproximadamente 37 categorías de mascotas para combinar con otras 200 imágenes asociadas con cada clase involucrada. Además, estos datos se pueden descargar directamente a través de los enlaces de la página web.
282. El conjunto de datos del genoma visual
La API de Visual Genome es el resultado final del arduo trabajo realizado por varios estudiantes y profesores asociados de la Universidad de Stanford. Con varios documentos a su nombre en la búsqueda de crear una API capaz de evaluar y describir imágenes, el programa ha respondido con éxito a más de un millón de preguntas mientras evalúa más de 100 000 imágenes. Esta API representa un progreso en el área de la informática y sus campos relacionados y el conjunto de datos se puede descargar directamente en el sitio.
283. caras de youtube
La base de datos de rostros de YouTube se centra en desarrollar una solución al problema del reconocimiento facial automático en videos. En total, el conjunto de datos tiene más de 3000 videos tomados de YouTube de casi 1600 personas con una duración promedio de aproximadamente 181 cuadros. En última instancia, el objetivo es crear un algoritmo capaz de crear etiquetas que identifiquen a la persona que está en el video. Los datos junto con la información sobre errores, así como los métodos de descripción, están disponibles para su visualización directamente en el sitio.
284. Repositorio de conjuntos de datos KEEL
El repositorio de conjuntos de datos de KEEL contiene el conjunto de datos del software de código abierto basado en Java que está diseñado para ayudar en varios tipos de descubrimiento de datos de conocimiento. KEEL, conocido simplemente como Extracción de conocimiento basada en el aprendizaje evolutivo, se puede entrenar para aprender a agregar valores faltantes, modelos híbridos y métodos estadísticos para evaluar experimentos, entre otras tareas. Las descargas de conjuntos de datos, así como una lista completa de los algoritmos presentados en KEEL, se pueden descargar directamente desde el sitio.
285. Club de préstamos
El reclamo a la fama del Lending Club es su condición de prestamista entre pares que permite a los prestatarios recibir préstamos incluso cuando no necesariamente tienen el puntaje crediticio para pedir prestado a los prestamistas tradicionales. Junto con los aspectos novedosos de cómo funciona el sitio, también proporciona estadísticas que incluyen aspectos destacados de la plataforma, información sobre préstamos rechazados, cifras de rendimiento de los inversores e incluso un diccionario de datos que contiene datos históricos. Estos números generalmente comienzan a partir de 2007 y se pueden descargar en CSV.
286. Museo de Historia Natural
Muchos consideran que el Museo Natural de Historia es uno de los museos más reconocibles del mundo, pero la digitalización y la capacidad de examinar su catálogo a través del portal de datos abiertos probablemente sería una novedad para mucha gente. Con 91 conjuntos de datos que incluyen colecciones de microfósiles y fósiles, así como registros de lotes índice entre otros materiales, los datos están abiertos al público y se pueden descargar de forma gratuita en múltiples formatos.
287. Los vocabularios de Getty
Este sitio es perfecto para periodistas y editores que desean mantenerse dentro de ciertas pautas de estilo al describir y categorizar ciertas obras de arte, nombres de artistas, arquitectura, materiales y nombres geográficos. Este sitio vincula a los usuarios directamente con las bases de datos de vocabulario controlado que los investigadores y catalogadores necesitan conocer para cumplir con los estándares internacionales. Al menos aquí, no hay nada mejor que los vocabularios de Getty. Los conjuntos de datos se pueden explorar a través de texto o SPARQL y se pueden descargar a través del sitio.
288. Corpus de investigación de estilometría CLiPS (CSI)
El corpus de investigación de estilometría CLiPS probablemente no sea lo que la mayoría de la gente piensa cuando escucha las palabras CSI, pero el corpus CSI es, sin embargo, un conjunto de datos compuesto por reseñas y ensayos de estudiantes. Además del texto en sí, el sitio señala que la presencia de metadatos e información incrustados en el documento tiene múltiples usos. Ofrecido y distribuido bajo la licencia Creative Commons, todo lo que el corpus pide a cambio de usar el conjunto de datos es una atribución.
289. Dependencias universales v2
Universal Dependencies v2 se refiere a la segunda versión actualizada del proyecto Universal Dependencies, un esfuerzo por desarrollar una anotación de banco de árboles que se puede usar de manera consistente con varios idiomas diferentes. En la versión actualizada, los investigadores encontrarán docenas de bancos de árboles UD para diferentes idiomas, incluidos afrikaans, griego antiguo, japonés, holandés, finlandés y chino además de inglés. La versión más reciente de Universal Dependencies se puede encontrar y descargar cerca de la parte inferior de esta página web.
290. manguera
Webhose es una fuente de primer nivel de conjuntos de datos tomados directamente de los repositorios del sitio y abiertos al público. Los investigadores pueden ordenar los artículos de noticias por idioma, siendo el árabe, el francés y el holandés solo algunos de los idiomas con números de artículos que suman más de 100.000. Además, los artículos de noticias en inglés se dividen en categorías como entretenimiento y deportes para acompañar las reseñas y las publicaciones del foro. Los editores e investigadores digitales pueden beneficiarse de la exploración de estos conjuntos de datos.
291. datos wiki
Wikidata es una fuente subestimada de contenido e ideas para editores e investigadores por igual. De acuerdo con esta página, hay varias formas de acceder al material en los volcados de datos, aunque el uso de JSON es el que el sitio recomienda con más fuerza. Disponible y totalmente gratuito para uso comercial y no comercial, todos los datos disponibles aquí se pueden acceder y descargar de forma gratuita bajo la licencia Creative Commons.
292. Enlaces wiki
Ubicado cómodamente dentro del marco de Google Code, Wiki Links es un proyecto de código abierto que busca brindar a las personas acceso a ese conjunto de datos único y particular. En esta página web, los investigadores pueden descargar los textos README, los archivos de datos y la licencia Creative Commons en conjunto. Los editores o, en general, las personas orientadas a la tecnología tienen mucho que esperar al revisar este conjunto de datos masivo. Simplemente navegue por el sitio, haga clic y comience a descargar los archivos.
293. red de palabras
WordNet es un léxico en inglés compuesto por los componentes del idioma, adverbios, sustantivos, adjetivos y verbos que se clasifican en grupos distintos que luego se usan para expresar ideas particulares. El resultado final es una herramienta útil que clasifica las palabras según cómo se usan y qué significan, en lugar de cómo suenan cuando se pronuncian. Se destacan las aplicaciones de WordNet en la programación lingüística junto con las numerosas publicaciones y estadísticas disponibles en el sitio.
El Allen Brain Atlas, creado por el Allen Institute for Brain Science Resources, es una herramienta para estudiar y aprender más sobre el cerebro humano y cómo responde cuando el cuerpo humano está sano y cuando hay una enfermedad. Usando el atlas, los investigadores pueden aprender sobre el cerebro humano y su desarrollo, así como sobre el glioblastoma y el efecto del cáncer en el cerebro. Los periodistas que cubren estos temas pueden visitar este sitio para obtener conjuntos de datos e información.
295. NITRC
El NITRC, o el Centro de Intercambio de Recursos y Herramientas Informáticas de Neuroimagen, es donde los periodistas y editores pueden acudir en busca de neuroimagen. Reunido y promovido como una iniciativa para compartir datos de neuroimágenes, este sitio alberga datos de varios proyectos, como el Proyecto 1000 Connectome, la Iniciativa preprocesada de Addiction Connectome, así como los proyectos INDI-Prospective y Retrospective, respectivamente. Las personas pueden descargar los datos a través del sitio web. Las neuroimágenes tomadas en varias etapas nunca han sido tan accesibles.
296. HCP adulto joven
El proyecto para adultos jóvenes del Proyecto del conectoma humano es una continuación del esfuerzo continuo para crear un mapa preciso del conectoma humano tal como se vería en la mayoría de los adultos normales. A través de dos fases, 1200 adultos sanos fueron escaneados a través de una combinación de técnicas en resonancia magnética funcional en estado de reposo e imágenes de difusión. Los periodistas y editores en busca de información sobre el cerebro no encontrarán otro sitio con más datos sobre el conectoma humano en adultos jóvenes sanos.
297. Archivo de datos del NIMH
El archivo de datos del NIMH, o NDA para abreviar, no es tanto una fuente de datos independiente como una plataforma para distribuir y almacenar datos. En este sitio web, hay datos que se han recopilado a lo largo de múltiples documentos y proyectos de investigación, así como la provisión de métodos y herramientas que permiten un mejor análisis y colaboración. Los resúmenes de datos están disponibles gratuitamente y los proveedores de contenido que informan sobre lo último en ciencia pueden usar esta información para dar noticias.
298. neurodatos
NeuroData se dedica a realizar investigaciones sobre la relación única entre la mente y el cerebro. Gracias al compromiso del sitio con la ciencia abierta y la investigación reproducible, los proveedores de contenido tienen acceso a una publicación y varios conjuntos de datos a los que se puede acceder siguiendo los enlaces de la página web. De particular interés para aquellos que desean ver los datos por sí mismos es la disponibilidad de código gratuito y herramientas de análisis que hacen que la exploración del trabajo de NeuroData sea aún más sencilla.
299. neuroelectro
El Proyecto NeuroElectro está diseñado con la intención de recopilar las diversas características electrofisiológicas asociadas con diferentes tipos de neuronas y agregarlas en una sola base de datos. Este proyecto busca estudiar la relación entre las neuronas en un esfuerzo por estudiar las diferencias entre varios tipos de neuronas. El sitio enlaza con artículos y enumera los tipos de neuronas y las propiedades electrofisiológicas descubiertas hasta el momento. Los proveedores de contenido pueden confiar en este sitio como fuente de datos sobre las relaciones de neurona a neurona.
300. Serie de estudios de imágenes de acceso abierto
La serie de estudios de imágenes de acceso abierto, también conocida por muchos como OASIS, es un proyecto diseñado con el objetivo de hacer que los conjuntos de datos de resonancias magnéticas cerebrales sean accesibles para la comunidad científica en general. Los periodistas e investigadores pueden acceder a publicaciones que comparan datos de resonancia magnética entre adultos, así como a una hoja informativa completa del artículo completo de OASIS que compara y contrasta los resultados de más de 400 sujetos. La información y las herramientas se pueden descargar del sitio web en varios formatos.
301. OpenfMRI
Para los periodistas que desean acceder a conjuntos de datos de resonancia magnética sin ninguna de las molestias asociadas con algunos otros sitios, el enfoque de OpenfMRI.org en hacer que los conjuntos de datos de resonancia magnética sean accesibles al público es un avance positivo. Procedente directamente de los propios investigadores, este sitio alberga una variedad de conjuntos de datos, como el conjunto de datos de aprendizaje de clasificación, la tarea de apuestas mixtas y la tarea de toma de riesgos analógica del globo. La variedad y cantidad de datos hace posible que los investigadores encuentren nuevas vías de investigación a través de este sitio.
302. estudioforrest
Tomando prestado su nombre de la famosa película Forrest Gump, StudyForrest busca comprender de qué es capaz el cerebro cuando tiene que funcionar a un nivel superior mientras se enfrenta a una estimulación natural pero igualmente compleja. Aun así, el sitio reconoce que la cantidad de datos de fMRI recopilados de estos estudios tiene aplicaciones más amplias de lo que parece al principio. Los proveedores de contenido pueden navegar a través de las 19 publicaciones que han utilizado StudyForrest e incluso pueden acceder a los datos directamente.
303. Base de datos abierta de cristalografía
Como se esperaría naturalmente del título, la base de datos abierta de cristalografía es una colección de 385,697 minerales y compuestos orgánicos metálicos, estructuras cristalinas orgánicas e inorgánicas con la notable excepción de los biopolímeros. Los proveedores de contenido que buscan obtener más información sobre las estructuras cristalinas pueden buscar por fórmula estructural o ejecutar una consulta de búsqueda coincidente con la opción de navegar. También hay software y datos en este sitio que lo hacen especialmente valioso en el campo de la química.
304. Archivo de exoplanetas de la NASA
Considerada durante mucho tiempo como una de las principales fuentes de información sobre el espacio exterior, la NASA continúa con su tradición de ser un recurso invaluable con su archivo de exoplanetas. Este sitio alberga una serie de herramientas y software interactivos, como el Servicio de tránsito y efemérides, el Periodograma, la Herramienta de trazado de planetas confirmados y la capacidad de cargar archivos y tablas de búsqueda de forma interactiva. Los proveedores de contenido que buscan información única pueden usar estos datos para hacerlo la próxima vez que los exoplanetas sean una gran noticia.
305. Encuesta del cielo digital de Sloan
Cualquiera puede crear mapas tridimensionales del Universo con la ayuda del Sloan Digital Sky Survey, o SDSS. Tanto los reporteros como los proveedores de contenido pueden acceder a algoritmos, datos de imágenes, conjuntos de datos, tutoriales y un mayor desarrollo de materiales visuales con el fin de educar al público tanto formal como informalmente. El sitio también habla explícitamente de hacer que sus datos sean accesibles al público a través de las noticias y las redes sociales. Esta es una herramienta visual invaluable para los proveedores de contenido.
306. StatSci.org
Statsci.org ofrece una lista completa de recursos a los que el público puede acceder y utilizar según sus necesidades particulares. Parte de la información incluye el Servicio de conjuntos de datos electrónicos y estudios de casos compilados por UCLA. Junto con los conjuntos de datos sin procesar, también hay libros de texto vinculados en esta página. Esto incluye títulos como Handbook of Small Data Sets y Case Studies in Biometry. Los proveedores de contenido en busca de estadísticas no pueden equivocarse si echan un vistazo a esto.
307. eric
ERIC, también conocido como el Instituto de Ciencias de la Educación, es un recurso que actúa como motor de búsqueda para cualquiera que esté buscando información en el campo de la educación. La búsqueda preliminar incluso ofrece la opción de filtrar exclusivamente para información revisada por pares, así como para textos completos basados en ERIC. A la luz de la frecuencia con la que los presupuestos educativos y los métodos de enseñanza aparecen en las noticias, esta es una fuente de datos que los periodistas deben tener en cuenta.
308. NTIS
Creado poco después de la conclusión de la Segunda Guerra Mundial, el NTIS (Servicio Nacional de Información Técnica) se formó con el objetivo de usar datos para ayudar a las agencias federales a tomar decisiones informadas basadas en datos mediante el uso de datos. Esta agencia fue originalmente el repositorio de datos del gobierno de los Estados Unidos en el área de investigación científica. Hoy, el sitio alberga millones de publicaciones sobre una gran variedad de temas. La información histórica por sí sola hace que este sitio merezca ser una fuente de datos para periodistas y editores.
309. Certificado de datos abiertos
El sitio web del ODI (Open Data Institute) alberga lo que se llama el Certificado de Datos Abiertos, que es una herramienta gratuita disponible en línea que fue desarrollada con el propósito expreso de examinar críticamente y reconocer la calidad de los datos abiertos. Desde la perspectiva de un editor o periodista, el sitio también alberga numerosos conjuntos de datos sobre temas que van desde listas de subvenciones hasta alertas de alergias junto con listas que se pueden descargar en formato CSV.
310. Archivo GitHub
GitHub es fácilmente uno de los repositorios y archivos de datos más populares y conocidos en Internet debido a su facilidad de colaboración, capacidades de archivo y accesibilidad en lo que respecta a la codificación. Ya sea que se trate de intentos de crear bots que puedan realizar ciertas tareas o desarrollar aplicaciones, GitHub es un sitio donde los editores de contenido y los periodistas pueden tropezar fácilmente con productos potencialmente de interés periodístico. Se puede acceder al archivo siguiendo las instrucciones del tutorial para JSON o Big Query.
311. SocioPatrones
SocioPatterns es un proyecto que se centra en encontrar patrones en la actividad humana y la dinámica social a través de datos. Como era de esperar con un objetivo declarado tan amplio, la información del sitio se ha utilizado en publicaciones que abordan una variedad de temas, desde la propagación de enfermedades hasta estudios de casos sobre las diferencias entre las personas en línea y fuera de línea. Los conjuntos de datos están disponibles para su visualización, al igual que los artículos publicados que contienen información que los editores probablemente encontrarán relevante en un momento u otro.
312. Mapa independiente
Indie Map es el resultado de tomar información de más de 2000 de los sitios más concurridos de IndieWeb y convertir los datos en formas visuales interactivas, como una API de gráfico social, un conjunto de datos con capacidades de consulta SQL y la información sin procesar que se rastreó en un total de 5.7 millones de páginas web. Los editores digitales interesados en el software de código abierto y lo que estos datos podrían decir sobre estas comunidades en línea pueden acceder a la información directamente desde el sitio web.
Simon Fraser continúa construyendo sobre su estatus como una universidad de renombre con la disponibilidad de su conjunto de datos sobre "Estadísticas y redes sociales de videos de YouTube". Extrayendo información de un rastreador que usó la API de YouTube para encontrar videos, los archivos contienen datos sobre millones de videos y conjuntos de datos de información del usuario. El sitio especifica que las descargas de conjuntos de datos son solo para fines académicos, pero es posible encontrar fuentes periodísticas y referencias sobre este proyecto a través del sitio.
314. ACLED
ACLED, o el Proyecto de Datos de Eventos y Ubicación de Conflictos Armados, ofrece datos públicos sobre las protestas y la violencia política en el mundo en desarrollo. La información que se proporciona aquí incluye números de muertes, información sobre las fechas y lugares de la violencia o protesta, nombres de los grupos relevantes y datos sobre disturbios y enfrentamientos violentos que han ocurrido. ACLED brinda acceso a informes regulares, publicaciones y visuales, así como a datos que están disponibles para descargar en el sitio.
315. Instituto Canadiense de Información Legal
El Instituto Canadiense de Información Legal, o CanLII, como se le llama en el lenguaje habitual, es un sitio que brinda acceso gratuito a estatutos y sus reglamentos, jurisprudencia de tribunales de varias jurisdicciones, incluido el Tribunal Supremo de Canadá, los tribunales provinciales y de apelación, y Queen's Tribunal, así como sentencias de diversos tribunales administrativos y órganos de creación estatutaria. Con 301 bases de datos de jurisprudencia y más de 140.000 decisiones judiciales disponibles para su visualización, los periodistas y editores digitales que cubren temas legales se beneficiarían de marcar este sitio como favorito.
316. Centro para la Paz Sistémica
El Centro para la Paz Sistémica, o CSP, es una organización que se ha dedicado a analizar los sistemas globales con el propósito de abordar el tema de la violencia política. En este sitio, los periodistas que realizan investigaciones en esta área tendrán acceso a análisis sobre conflictos en África, tendencias de conflictos a nivel mundial, entre otros, junto con resúmenes de las tres publicaciones principales de la organización, como Third World War y CSP's Global Report y Virtual Biblioteca.
317. Correlatos del proyecto de guerra
El enfoque del proyecto Correlates of War, o COW, es ayudar en la recopilación y distribución de datos cuantitativos en el área de las relaciones internacionales. Manteniendo su compromiso de aplicar principios científicos a los datos de relaciones internacionales, COW hace que sus conjuntos de datos sean de libre acceso para el público. Estas bases de datos contienen números sobre información que los periodistas e investigadores pueden usar, como conflictos militarizados entre estados, miembros del sistema estatal, capacidades materiales nacionales y alianzas formales.
La Encuesta Social Europea, o ESS, es una encuesta que se realiza en toda Europa con el objetivo de medir los diversos patrones de comportamiento, actitudes y creencias de diferentes poblaciones en varias naciones. Dado que los periodistas a menudo están interesados en obtener la opinión del público, la serie ESS Topline que cubre temas que van desde el bienestar personal y social de los europeos, las actitudes hacia el bienestar e incluso la presencia de la discriminación por edad en el Reino Unido, puede reforzar una historia en más caminos que uno.
319. Fondo para la Paz
El Fondo para la Paz es una organización que se enfoca en la prevención de conflictos y se concentra en la seguridad a través del desarrollo de herramientas que pueden usarse para mitigar los conflictos. A lo largo de su carrera, la FFP ha trabajado en asociación con periodistas, ONG, organizaciones locales y sus contrapartes internacionales, así como con gobiernos. Ya sea que busquen tendencias, análisis comparativos y datos globales, los periodistas y editores pueden encontrar los materiales que desean a través de la herramienta de exploración de datos en el navegador del sitio.
320. La Encuesta Social General
El trabajo de la Encuesta Social General (GSS, por sus siglas en inglés) se enfoca en recopilar información sobre varios aspectos de la sociedad estadounidense moderna como un medio para mantenerse al tanto de las tendencias y patrones de actitud y comportamiento en la población. Con esta práctica de seguimiento de tendencias que se remonta a 1972, los datos históricos por sí solos son una mina de oro para los periodistas que desean explorar las tendencias. Con GSS Data Explorer, los investigadores y periodistas pueden descargar, examinar e incluso evaluar datos.
321. Gesis
GESIS es un instituto de infraestructura alemán que se dedica a las ciencias sociales. Ofrece diferentes ciencias sociales, junto con trabajos de investigación y servicios que van desde la metodología de encuestas hasta la informática aplicada, la recopilación de datos, la planificación de estudios y el análisis de datos, por nombrar algunos de los que hace GESIS. Los periodistas interesados en temas como el enfoque metodológico de GESIS, la utilización de inmigrantes sobrecalificados y más, pueden encontrar mucha información en la sección de publicaciones.
322. Futuros religiosos globales
Desde temas como el aborto hasta la educación sexual, la religión es tan omnipresente que incluso en países mayoritariamente seculares, la posición de una persona sobre temas sociales difíciles puede verse influenciada por creencias religiosas. En Futuros Religiosos Globales, Pew Research Center examina las tendencias en las actitudes y creencias de las personas en relación con las religiones globales. Los periodistas que buscan examinar detalles como la influencia del evangelicalismo en la política o las actitudes hacia la lapidación pueden usar el Explorador de datos para encontrar respuestas en los números.
323. Índice para la gestión de riesgos
El Índice para la gestión de riesgos, también conocido como INFORM, es un lugar al que pueden acudir investigadores y periodistas para realizar evaluaciones de riesgos en situaciones en las que existe el riesgo de una crisis humanitaria o un desastre. La organización ofrece enlaces a datos sobre temas como las tasas de mortalidad infantil, el índice de desigualdad de género y la frecuencia de las sequías, entre otros números. También es posible ver y descargar los datos de INFORM o acceder a ellos a través del mapa interactivo del sitio.
324. INED
El INED, o Instituto Francés de Estudios Demográficos, es una de las fuentes de datos y estadísticas más prolíficas que un periodista puede encontrar en Internet. Con más de 70 publicaciones investigadas y publicadas cada año para ir con la población mundial en formato de gráfico, así como estadísticas que miden preguntas como la diferencia de fertilidad entre los sexos para ir con métodos de noticias y recursos. Los investigadores que buscan hallazgos precisos de una fuente confiable los encontrarán con INED.
325. Archivo de Redes Internacionales
El Archivo de Redes Internacionales de Princeton ofrece una combinación única de publicaciones, con investigaciones como Human Development Report 1999 y Global Networks: A Journal of Transnational Affairs disponibles para leer en este sitio. En este sitio, los periodistas podrán estudiar minuciosamente los datos públicos históricos y actualizados completos del archivo. Los temas cubiertos aquí incluyen atención médica, armas, libros, música, migración, regiones, Internet, política y transporte son solo una muestra de los materiales que los investigadores pueden leer aquí.
326. Programa de encuesta social internacional
Fundado desde un principio como un medio de colaboración entre personas de diferentes naciones, el Programa Internacional de Encuestas Sociales (ISSP) ha realizado encuestas cada año sobre una variedad de temas que son importantes en el área de las ciencias sociales. Los temas a lo largo de los años han incluido desigualdad social, identidad nacional, ciudadanía, redes sociales y orientación laboral, entre otros asuntos. Los hallazgos del ISSP se pueden buscar por año o por tema y se pueden descargar en consecuencia en el sitio web.
327. Asociaciones de estudios internacionales
Periodistas u otros investigadores que buscan debates informativos e intelectuales sobre temas relacionados con asuntos transnacionales, internacionales y globales, la Asociación de Estudios Internacionales (ISA) reúne la experiencia de investigadores, académicos y expertos en políticas entre otros nombres. La Enciclopedia de Estudios Internacionales de la ISA presenta ensayos revisados por pares que están llenos de discusiones en profundidad sobre temas relacionados con la investigación en este campo, así como ensayos que brindan información contada desde una perspectiva más histórica.
328. Datos transnacionales en la Web
La increíblemente útil página del profesor James W. McGuire de la Wesleyan's University, apropiadamente titulada Cross-National Data on the Web, es una página de recursos llena de enlaces a datos económicos y de desarrollo global relevantes. Entre los conjuntos de datos que los periodistas podrán descubrir aquí, hay datos sobre planificación familiar, logros educativos, desnutrición, agua y saneamiento, orientación al libre mercado e información específica de América Latina y el Caribe, por nombrar sólo algunos de la lista. Las fuentes de datos enumeradas aquí son impecables.
329. Centro Noruego de Datos de Investigación
El Centro Noruego de Datos de Investigación es una institución que apoya y ayuda a los investigadores en diferentes áreas de la realización de investigaciones empíricas, como privacidad, recopilación y análisis de datos, evaluación de metodologías y ética en la investigación. Aquí, los investigadores encontrarán software y herramientas desarrollados y recomendados por el centro para acompañar una extensa colección de datos regionales, individuales e institucionales a los que se puede acceder de forma gratuita. Las conclusiones del centro en el Informe anual de investigación y privacidad también son siempre una lectura interesante.
330. IPUMS
IPUMS no es necesariamente una fuente de datos en el sentido que la mayoría de la gente esperaría al escuchar el término, pero no obstante es una fuente útil para los periodistas debido a su papel como agregador, archivador y organizador de los datos que otras entidades le proporcionan. Por ejemplo, IPUMS USA actúa como una especie de depósito de datos para microdatos del censo de EE. UU., con datos que se remontan a 1790 y se remontan hasta el presente.
331. GANANCIA ND
El Índice de Países ND-GAIN, una iniciativa organizada por la Iniciativa de Adaptación Global de la Universidad de Notre Dame, mide la resiliencia de un país al cambio climático y otras fuerzas de la globalización. Este índice incluye puntuaciones de vulnerabilidad en áreas como alimentación, salud, infraestructura y ecosistemas, así como puntuaciones de preparación para hasta 500.000 puntos de datos. Esta información, que contiene dos décadas de datos desde los años 1995 hasta 2014 en forma de archivos CSV, está disponible para descargar.
332. policía reino unido
En este sitio, los periodistas y editores pueden acceder a datos abiertos sobre el estado de la policía y el crimen en el Reino Unido. Los datos contienen estadísticas útiles sobre equipos vecinales, fuerzas policiales individuales, números de detención y registro, así como estadísticas sobre delitos y resultados. Usando este sitio, los periodistas pueden realizar comparaciones entre las fuerzas policiales y detectar tendencias en la justicia penal. Obtener información es tan simple como elegir el rango de fechas, elegir la fuerza policial y luego esperar el archivo.
333. Página de datos internacionales generales de Paul Hensel
La página de datos internacionales generales de Paul Hensel es una serie de enlaces que se agrupan bajo los encabezados Estados y el sistema internacional, datos geográficos internacionales, capacidades estatales, colecciones de datos de ciencias sociales y alianzas, tratados y organizaciones. Cada recurso enumerado en esta página web contiene datos de última generación que automáticamente darán credibilidad al trabajo de un periodista. Estas fuentes pueden incluir cualquier cosa, desde software hasta conjuntos de datos y archivos, pero todos los enlaces incluidos aquí son útiles.
334. TRAC
En el mundo posterior al 11 de septiembre, el terrorismo y sus efectos devastadores en las poblaciones locales han recibido mucha atención en los medios de comunicación. TRAC, en trackingterrorism.org, proporciona a los investigadores un amplio análisis e información sobre estos temas. Este sitio contiene información sobre varios miles de grupos terroristas diferentes. El precio de usuario único de $500 puede ser un poco elevado por adelantado, pero vale la pena el precio pagado por aquellos que escriben sobre la violencia y la guerra contra el terrorismo.
335. Departamento de Justicia Penal de Texas
¿Está interesado en el funcionamiento interno del sistema de justicia penal de Texas? ¿Tiene curiosidad por saber quién está actualmente en el corredor de la muerte? El Departamento de Justicia Criminal del Estado de Texas tiene mucha información de las últimas declaraciones de los prisioneros antes de la ejecución, estadísticas del corredor de la muerte por género y raza, así como más estadísticas y hojas informativas sobre ejecuciones. El Departamento de Justicia Criminal de Texas es una fuente confiable para los periodistas.
336. Sistema Integrado de Organizaciones de la Sociedad Civil
El Sistema Integrado de Organizaciones de la Sociedad Civil, o iCSO, está diseñado para facilitar la comunicación de las organizaciones de la sociedad civil con el Departamento de Asuntos Económicos y Sociales. Además de la efectividad del marco robusto, la página web incluye conjuntos de datos y categorías para obtener más información. Los datos se pueden ordenar por sector, el tipo de organización, la región involucrada y el estado ECOSOC de la organización. Esta es una fuente de datos que los periodistas definitivamente pueden usar para encontrar fuentes.
337. Universidades en todo el mundo
Universities Worldwide es una base de datos de universidades de todo el mundo que se puede buscar para obtener más información. La búsqueda se puede realizar por lista mundial o filtrar exclusivamente a universidades de los Estados Unidos, y los usuarios también pueden agregar sus propios enlaces en el proceso. Los editores de datos con un contingente considerable de estudiantes, o incluso los periodistas que buscan verificar un hecho, pueden beneficiarse al poder acceder a una base de datos como esta bajo demanda.
338. Programa de datos sobre conflictos de Uppsala
Este es el sitio web del Programa de Datos de Conflictos de Uppsala, que es uno de los proveedores de información más conocidos sobre la violencia organizada. En el transcurso de los últimos 40 años del programa, también se ha establecido por su trabajo en la recopilación de datos de la guerra civil. Los periodistas pueden usar esta fuente de datos para buscar información sobre conflictos y actores específicos en esos conflictos y también pueden acceder a estos datos para descargarlos.
339. pop mundial
El proyecto WorldPop, el resultado final de la fusión de los proyectos AsiaPop, AfriPop y AmeriPop, está dedicado al archivo de conjuntos de datos demográficos espaciales que, a su vez, tienen aplicaciones como medio para brindar apoyo a los esfuerzos de socorro en casos de desastre. Los editores de contenido y los periodistas que están involucrados con causas de justicia social o que están investigando oportunidades eficientes de socorro en casos de desastre estarían interesados en este proyecto. Los investigadores pueden descargar los datos o revisar los estudios de casos en línea.
340. Borrador expreso
DraftExpress es quizás más conocido en Internet por sus investigaciones, informes de exploración previos al draft, selecciones simuladas y su meticuloso mantenimiento de las alturas y medidas de los jugadores junto con sus datos históricos. Los prospectos mencionados en este sitio provienen de la NCAA, la escuela secundaria e incluso ligas internacionales. Los periodistas deportivos o proveedores de contenido que deseen ofrecer comentarios relacionados con el baloncesto pueden recurrir a las estadísticas de DraftExpress mientras analizan los jugadores y los eventos que ocurren dentro del deporte.
341. Betfair
Betfair es quizás mejor conocido como el sitio al que acudir para realizar apuestas deportivas. Sin embargo, es de interés para los proveedores de contenido y los editores digitales en particular la disponibilidad de información histórica detallada sobre los datos y el historial de precios del sitio. Se puede acceder y descargar los datos con o sin la marca de tiempo detallada y, al mismo tiempo, se ofrecen datos extensos sobre las carreras de caballos y otras ofertas de mercado del sitio desde junio de 2004 hasta octubre de 2017.
342. HOJA DE CRIC
Cricsheet ofrece un servicio similar a otros centros de datos deportivos, pero es un sitio que se especializa exclusivamente en proporcionar datos de cricket. El sitio ofrece estadísticas y datos bola por bola de varias ligas, incluida la Indian Premier League, partidos internacionales de un día, así como números de equipos masculinos y femeninos, por nombrar solo algunas de las categorías más importantes. Los editores de contenido en busca de datos históricos de cricket pueden descargar los datos en formato CSV o XML.
343. Datos de series temporales transnacionales
Con datos políticos, económicos, legislativos y de conflictos internos que cubren más de 200 años de datos en más de 200 países de todo el mundo, el Archivo de datos de series temporales entre países es uno de los conjuntos de datos más completos de Internet. Los datos se almacenan, de manera más conveniente, en una hoja de Google Drive que se abre automáticamente al hacer clic en la categoría del archivo. A cambio de una cita, esta información puede ser vista en parte o en su totalidad dependiendo de las necesidades del investigador.
344. Ford GoBike
Ford GoBike es el nombre del programa de bicicletas compartidas que se utiliza en el Área de la Bahía. Si bien muchas personas, sin duda, utilizan este programa para mantenerse en forma y evitar el uso de combustibles fósiles, el sistema de bicicletas públicas ha estado realizando un seguimiento de los datos del viaje. Por supuesto, esta información no incluye nada que pueda identificar a los ciclistas, pero los datos incluyen detalles como el número de bicicleta, la hora de inicio, la hora de finalización, el tipo de ciclista y las estaciones de llegada y salida. Eso vale la pena explorar.
345. Tráfico marítimo
Marine Traffic es una empresa que rastrea y realiza un seguimiento de los movimientos de embarcaciones y viajes marítimos utilizando big data. El tipo de información cubierta a través de los servicios AIS API de Marine Traffic incluía embarcaciones, información sobre los viajes y datos sobre las embarcaciones en cuestión, como llegadas esperadas, incluso incidentes, fotos, detalles de la embarcación y pronósticos de viaje. Sin embargo, hay planes de precios en este sitio, por lo que no está claro cuánta investigación se puede hacer de forma gratuita.
346. Bixi
Los programas de bicicletas compartidas de Bixi son quizás algunos de los programas de bicicletas compartidas más conocidos en algunas de las ciudades más grandes de América del Norte. Curiosamente, la marca también publica datos abiertos que brindan información sobre cosas como el historial de viajes y el estado de la estación, así como las comparaciones que se pueden hacer entre miembros y usuarios ocasionales. Los periodistas locales que están investigando cómo las personas están usando y adaptando los programas de bicicletas públicas a sus vidas tienen todas las razones para saltar a estos datos.
347. Base de datos de accidentes
Desde Amelia Earhart hasta el vuelo 8501 de AirAsia de Indonesia, los accidentes de vuelo y aviones son un tema que atrae la atención de la gente. La base de datos de accidentes archiva y almacena datos sobre accidentes de aviación que ocurrieron entre los años 1920 y 2017. Los accidentes contados en esta base de datos incluyeron accidentes de aeronaves civiles y militares, accidentes que involucraron la muerte de celebridades o alguien famoso, accidentes de helicóptero con 10 o más muertes. , vuelos aéreos regulares y no regulares de pasajeros que terminaron en muerte.
Transport for London es el organismo gubernamental responsable de supervisar el transporte público en el área metropolitana de Londres. Hay mapas de metro y tren disponibles en el sitio web junto con una guía de planificación de viajes. Además de todos estos servicios prácticos, el sitio también alberga una gran cantidad de datos abiertos, incluidos el ciclismo, la calidad del aire, la tina e incluso la ostra. Cualquier persona interesada en ver cómo los residentes del Gran Londres utilizan el transporte público puede beneficiarse de tener acceso a estos datos.
349. CMAP
CMAP es responsable de realizar la planificación y organización regional en los condados de DuPage, Lake, McHenry, Kendall, Kane, Cook y Will en Illinois. Como se puede ver en el sitio web, las responsabilidades de CMAP se extienden a abordar temas como el desarrollo comunitario, los impuestos y los indicadores económicos, e incluso las carreteras y el tránsito. Esta es la razón por la que los datos abiertos relacionados con áreas como los indicadores regionales y los viajes son útiles para un periodista que intenta comprender el panorama general en lo que respecta al futuro de la región.
350. Marco de análisis de carga
Producido gracias a una colaboración entre la Oficina de Estadísticas de Transporte y la Administración Federal de Carreteras, Freight Analysis Framework recopila datos que luego se utilizan para evaluar el estado general y el rendimiento del sistema de carga. Este software recopila información sobre detalles como el tipo de producto y el tonelaje en comparación con las estaciones de salida y llegada y, a su vez, esos datos se han puesto a disposición del público para acceder y descargarlos, ya sea en forma completa o resumida.
351. Ciencia de Mozilla
Mozilla Science es un software colaborativo de código abierto y práctica abierta que está ahí para ayudar en el desarrollo y distribución de diferentes fuentes de datos y hallazgos de investigación. Dejando a un lado los intereses de transparencia, la decisión de abrir programas y el proceso de refinamiento colaborativo hace que sea más fácil mejorar los programas que ya existen. Con proyectos disponibles en una variedad de campos que incluyen ciencias de la vida y medicina, entre otros, aquí hay soluciones de software que pueden representar un progreso de interés periodístico en el campo.
352. Conjuntos de datos interesantes
La atracción cuando se trata de Cool Datasets es fácilmente evidente por el nombre del sitio. En esta página, los conjuntos de datos se dividen en seis categorías generales en gobierno, entretenimiento, ciencia, envíos de usuarios, varios y aprendizaje automático. Los periodistas a quienes les gustaría explorar los datos y buscar historias pueden sacar el máximo provecho al consultar lo que este sitio web tiene para ofrecer. Hay una opción para explorar los conjuntos de datos y, si es posible, contribuir también con conjuntos de datos.
353. Monitoreo de datos abiertos
OpenDataMonitor es una plataforma que toma conjuntos de datos públicos y los presenta de una manera más intuitiva y fácil de seguir para las personas. Los investigadores pueden ir a la plataforma para ver un resumen de lo que son capaces de hacer los recursos de datos abiertos, y podrán ver los datos existentes que se les presentan de una manera más atractiva visualmente. El sitio explica su metodología y puntos de referencia, y los editores no deberían tener problemas para encontrar datos que valga la pena publicar.
354. Crunch Base
CrunchBase es quizás mejor conocido por su énfasis en las estadísticas y su compromiso de hacer que sus lectores accedan a los mejores datos disponibles. Las personas con mentalidad empresarial visitan este sitio todos los días para conocer las últimas tendencias en inversión e industria. Aquí, los periodistas y editores encontrarán noticias y discusiones frescas sobre las últimas tendencias comerciales. Mientras tanto, como parte de su opción de pago, el sitio también alberga extensos conjuntos de datos que se pueden analizar con las herramientas de software de Crunchbase.
355. Índice
Index es una plataforma con una propuesta de venta única porque tiene algo que ofrecer a todos, desde nuevas empresas, inversores, analistas y corporaciones. El sitio también alberga información sobre más de 100.000 empresas del sector tecnológico y, al mismo tiempo, ofrece a los usuarios la posibilidad de clasificar, crear y exportar hojas de cálculo. Los editores y periodistas que hojean los titulares en busca de posibles ángulos de la historia pueden adelantarse a las noticias de negocios a través de este sitio. Index puede ser inusual, pero no hay duda de que es un recurso útil.
356. SEMRUSH
SEMrush se enorgullece de ser una de las herramientas de inteligencia de búsqueda mejor establecidas disponibles para los especialistas en marketing en línea. Entre la academia y los seminarios web, los investigadores tienen todas las oportunidades para aprender los fundamentos. Sin embargo, el blog y las secciones de noticias contienen suficiente información para que los editores y periodistas puedan mantenerse al tanto de las últimas noticias sobre publicidad en línea y SEO. Los servicios de SEMrush tienen un precio, pero ofrecen mucha información de calidad de forma gratuita.
357. Ahrefs
Ahrefs quizás se resuma mejor como un conjunto de herramientas de marketing que son potencialmente útiles para cualquier persona que publique contenido en línea. El sitio ofrece una combinación de servicios como investigación de contenido, monitoreo web, investigación de palabras clave e investigación de vínculos de retroceso para ayudar a los usuarios a realizar ingeniería inversa del éxito de los competidores. Probablemente más útil para los editores en línea en el gran esquema de las cosas, el blog de Ahrefs por sí solo representa un excelente valor para aquellos a quienes les gusta que su mercadeo se haga con una inclinación basada en datos.
358. Lista de ángeles
AngelList, con su nombre inteligentemente elegido, es básicamente dos partes de Craigslist y una parte de LinkedIn con su énfasis en reunir a inversionistas, buscadores de empleo y nuevas empresas en un solo lugar. Junto con este interesante concepto de sitio, hay muchas oportunidades para que los periodistas emprendedores descubran las nuevas empresas más populares y las tendencias de inversión más recientes antes de que se conviertan en la corriente principal. Con su interfaz sencilla y su fuerte orientación comercial, este sitio es útil para los profesionales en más de un sentido.
359. Adquirido
En casi todos los sectores, la adquisición de una empresa puede cambiar toda una industria prácticamente de la noche a la mañana. Acquired es un sitio que asume la tarea de mantener informado al público cuando se realiza una adquisición en el sector tecnológico. Lleno de estadísticas que se pueden ver en el sitio junto con la capacidad de filtrar búsquedas, los periodistas que escriben sobre tecnología se beneficiarán al máximo al hacer que Acquired sea una parte regular de su navegación web diaria.
360. Marca de materia
Mattermark es un servicio de pago que facilita la vida de los responsables de la toma de decisiones de la empresa mediante la producción de listas de clientes de calidad que tienen en cuenta tanto a las empresas como a sus empleados clave. Al proporcionar perfiles completos de la empresa, flexibilidad con su API e incluso capacidades de exportación con el fin de realizar actualizaciones, Mattermark hace todo lo posible. Las empresas que desean orientar mejor su alcance y al mismo tiempo realizar un seguimiento de los resultados de sus campañas pueden ganar bastante al registrarse para esto.
361. Fintechstartups
FintechStartupsCo sirve como un tipo de agregador que realiza un seguimiento de cuánto han podido recaudar diferentes empresas en sus OPI. Con un diseño minimalista que cambia entre las pestañas "startups" y "noticias", esta es una manera rápida y fácil para que los periodistas se mantengan al tanto de las últimas noticias sobre recaudación de fondos. Mientras tanto, los editores que buscan contenido rápido e historias rápidas también se beneficiarán al echar otro vistazo a lo que este sitio tiene para ofrecer.
362. zorro de datos
En caso de que el nombre no lo delatara todo, DataFox es una empresa que se esfuerza por brindar a sus clientes comerciales la información que necesitan para maximizar sus CRM y, en general, tomar decisiones basadas en datos. Ofreciendo servicios que incluyen conferencias e inteligencia de la empresa, API y señales de la empresa, esta empresa es efectivamente una ventanilla única para las empresas que están renovando su trabajo de ventas y divulgación. Los editores digitales y los proveedores de contenido también pueden querer comprobarlo.
363. Envío abierto
OpenSpending es una plataforma gratuita, a la que se puede acceder prácticamente desde cualquier parte del mundo, que permite a los usuarios buscar y examinar datos financieros de dominio público. Para los miembros de la sociedad que no son hackers, esta es una herramienta poderosa para visualizar y analizar. Los periodistas, en particular, pueden usar OpenSpending para encontrar nuevos conocimientos interesantes y buscar ángulos de la historia como sugiere la compañía directamente en su sitio. Como beneficio adicional, los periodistas se encuentran entre las profesiones solicitadas específicamente en el foro.
364. API de deportes de ESPN
No contento con ser el canal de deportes más popular por cable, ESPN está expandiendo su influencia hacia la codificación y las API. En el Centro de desarrolladores, el sitio ofrece a los editores su selección de varias API que incluyen notas de investigación, clasificaciones de poder, selecciones de borradores, calendarios y titulares. Incluso hay una API que carga perfiles de atletas, biografías y estadísticas en todos los deportes principales. Los periodistas que se están preparando para escribir una historia con contenido deportivo solo pueden beneficiarse de la navegación a través de estos.
365. Referencia deportiva
Para los amantes de los deportes a los que les gustan las estadísticas avanzadas y los recursos en un solo lugar, Sports Reference es uno de los mejores sitios en la web. Con datos históricos que incluyen estadísticas de equipos y jugadores en ataque y defensa, los investigadores deportivos pueden ir tan amplios o estrechos como quieran con este sitio. Además, hay números para prácticamente todos los deportes principales, desde el baloncesto hasta el béisbol, y también datos separados para diferentes deportes universitarios.
366. Conjunto de datos de millones de canciones
La acertadamente llamada "Colección de un millón de canciones" representa un total de 28 conjuntos de datos de metadatos e información sobre las funciones de audio de exactamente un millón de canciones. En gran parte como resultado del trabajo de LabROSA de la Universidad de Columbia junto con Echo Nest, esta información es accesible y está alojada en el sistema AWS de Amazon. Los usuarios pueden realizar búsquedas de información a través de Infochimps, lo que lo hace aún más accesible para los periodistas en busca de curiosidades oscuras, así como para los editores de contenido.