2010年8月9日月曜日

como divulgacion nuestra operacion de periodismo de datos funccionar

Wikileaks Afghanistan war logs
how our data-jounalism operation worked
by Simon Rogers
guardian.co.uk, Tuesday july 27, 2010
http://www.guardian.co.uk/news/datablog/2010/jul/27/wikileaks-afghanistan-data-datajournalism

Wikileaks guerra "Afganistán registros: cómo divulgación nuestra operación datajournalism workedThe Wikileaks de miles de registros de guerra de Afganistán fue datajournalism en acción. Así es como lo hicimos • Obtener los datos visión general • Selección de Guardian de los principales acontecimientos del Afganistán Wikileaks archivos: los datos (55) Tweet este (260) Comentarios (17) Wikileaks Afganistán datos: haga clic en la imagen para el gráfico. Foto: Paul Scruton para el Guardian Bueno, siempre quería historias a partir de datos: ahora lo tenemos. En espadas. Con cascabeles en. La guerra Wikileaks 'Afganistán se registra una victoria fantástica para basedjournalism datos de la investigación, no sólo aquí en el Guardian, pero en el New York Times y Der Spiegel también. También es datajournalism en acción. Lo que queríamos hacer era permitir que nuestro equipo de periodistas especializados para obtener magníficas historias humanas de la información - y pensamos que era analizar para conseguir el cuadro grande, para mostrar cómo la guerra va realmente. Ha sido un mes muy ocupado para aquellos de nosotros que trabajamos con los datos en el Guardian, así es como hemos llegado hasta aquí. Era fundamental para lo que haría muy pronto que no está dispuesto a publicar la base de datos completa. Wikileaks ya se va a hacer eso y queríamos asegurarnos de que no reveló los nombres de los informantes o innecesariamente en peligro las tropas de la OTAN. Al mismo tiempo, necesitamos que los datos sean más fáciles de usar para nuestro equipo de reporteros de investigación: David Leigh, Nick Davies, Declan Walsh, Tisdall Simon, Richard Norton-Taylor. También hemos querido hacer más simple el acceso a la información clave para que usted, allá en el mundo real - lo más clara y abierta como lo pudimos hacer. Los datos vienen a nosotros como un enorme archivo de excel - más de 92.201 filas de datos, algunos sin nada en absoluto o son el resultado de formato pobres. Cualquier cosa más de 60.000 filas o trae para sobresalir en forma dramática - el ahorro, de un periodo largo de tiempo dolorosamente (número uno punta - a su vez fuera de guardado automático en las preferencias ...). No ayuda a los periodistas tratando de arrastre a través de los datos de historias y de que sea demasiado grande para ejecutar informes significativos sobre. Afortunadamente, después de COINS, enormes conjuntos de datos tienen ningún temor por nosotros. Harold Frayman, quien junto con John Houston forcejea con regularidad los datos de archivos PDF y otros formatos para la Datablog - construyó una base de datos interna simple. Reporteros ahora podría buscar historias para palabras clave o eventos. De pronto se convirtió en el conjunto de datos accesibles y la generación de grandes historias se volvió más fácil. Los datos fueron bien estructurado (puede leer más acerca de cómo esa estructura trabajado aquí), es decir, los acontecimientos se clasifican, a veces más confiable que otros. También comenzó a filtrar los datos que nos ayuden a contar una de las historias clave de la guerra: el aumento de la IED (dispositivo explosivo improvisado) ataques - bombas de fabricación casera que son imprevisibles e imposibles de combatir. Este conjunto de datos aún masiva - pero más fácil de manejar. Había alrededor de 7.500 explosiones o emboscadas IED (una emboscada es donde el ataque se combina con, por ejemplo, granadas de fuego de armas pequeñas o un cohete) entre 2004 y 2009. Había otros 8.000 artefactos explosivos improvisados que se encontraron y se aclaró. Queríamos ver cómo cambiaron con el tiempo - y cómo se comparan. El resultado son los datos más abajo - que nos muestra: • IED ataques con el tiempo • En caso de que paso por regiones • Los datos de víctimas registradas en la base de datos Descargar la hoja de cálculo visión completa Las bajas de datos trajo sus propios desafíos - a menudo es inexacta e incompleta compilado - hemos añadido bajas de la OTAN-grabado también para probar la veracidad de los datos y se puede ver cómo varían. Pero estos datos panorama no expresa la magnitud de los miles de explosiones. Un período en particular - los tres días en el período previo a las elecciones presidenciales del año pasado vio a más de 100 artefactos explosivos improvisados explotar. Imagine que viven con el que cada vez que salió en un camión en el camino? Aquí es donde el desarrollador Daithi Ó Crualaoich entró y nos ayudaron a mapear el lats y anhela de cada evento - no sólo eso sino que se produce un mapa editable (vectores, los diseñadores llaman así). Y a continuación, el diseñador gráfico Pablo Scruton podría hacer que ese hermoso para el periódico (se puede descargar desde Scrib'd abajo). Afganistán IED ataques - desde 2006 hasta 2009 Transmitir la información en línea es una habilidad diferente - Alastair Dant (con la ayuda de Igor Clark) creó dos interactivos para el sitio: • Una guía interactiva para todos los artefactos explosivos improvisados, trabajando desde una hoja de cálculo con los datos geográficos sobre (con el trabajo de diseño de Paddy Allen y McCormick Mark) • interactivo de la página frontal a nuestra selección de 300 eventos clave. Los eventos clave fueron seleccionados por el equipo de investigaciones como particularmente interesantes - Guía de Alastair le ayuda a navegar alrededor de ellos, cada uno haciendo clic en uno a través de una página creada por Harold (con la clave para desarrollar el trabajo por Daithi y Lisa van Gelder) donde los usuarios pueden leer el completo informe. Queríamos hacer la mayor cantidad de datos brutos disponibles como hemos podido y hemos publicado algunos grandes conjuntos de datos: • El conjunto completo de incidentes significativos elegido por especialistas Guardian • Los datos de los ataques con IED Es inevitable el caso de que el trabajo que la ayuda a formar una historia es menos interesante que la historia misma. Pero en el futuro, a medida que más y más de estos conjuntos de datos son puestos en libertad, estas son habilidades que los periodistas tendrán que resolver. Como Roy Greenslade escribió ayer: La nueva forma de divulgación a través de Internet, pionero con tanto éxito en el último par de años por Wikileaks, merece nuestra alabanza y debe ser defendida contra las fuerzas reaccionarias que tratan de evitar la exposición. ¿Hemos publicado lo suficiente? Inevitablemente no. Hemos empezado a dar sentido a un conjunto de datos muy complejos? Esperamos que sí. Ahora es tu turno. ¿Puede ayudarnos a tener más sentido de la información en bruto?

0 件のコメント:

コメントを投稿