2010年10月27日水曜日

Wikileaks Irak : ¿que hay de malo en los datos? 25 Oct. 2010 : the Guardian

Wikileaks Iraq: what's wrong with the data?

How reliable is the Wikileaks Iraq data? An insider explains its limits
How data journalism mapped Iraq's deaths


Wikileaks Irak: ¿qué hay de malo en los datos?
¿Qué tan confiable son los datos Wikileaks Irak? Una fuente explica sus límites• ¿Cómo el periodismo datos cartográficos muertes de Irak
guerra de Irak registra muertes asignadas gráfico Wikileaks guerra de Irak registros de muertes asignado. Obtener el mapa
Wikileaks enorme emisión de Irak de datos ha dominado las noticias de este fin de semana. Y, como parte de nuestro esfuerzo para explorar la enorme masa de datos, se asigna a cada muerte registrada.
Esta es una de las mayores - y más sensibles - los conjuntos de datos en ser puesto en libertad, y proporciona una gran fuente de información para cualquier persona interesada en saber lo que realmente sucedió en Irak. Oficialmente conocida como la base de datos SIGACTS - Acciones significante - una versión está disponible desde hace algunos académicos para analizar en los EE.UU. desde hace algún tiempo.
Uno que ha trabajado con las partes de la base de datos nos ha dado una visión fascinante de cómo fue cotejada. La base de datos es tan grande que sólo por las muertes de seleccionar el mapa que podría faltar una imagen aún más grande, dice Jacob Shapiro, profesor asistente de Política y Asuntos Internacionales en la Universidad de Princeton. Señala tres cuestiones importantes con el SIGACTS:

    
• No se trata de "toda la muerte" o algo parecido. Se trata de todas las muertes registradas por las Fuerzas Multinacionales de Irak. Hay un subregistro de estos datos para un número de razones, incluyendo: (1) no hubo la coalición o de unidad iraquí en torno al registro de la muerte, (2) la Coalición y las unidades iraquíes en la zona se dedicaban a niveles tan altos de combate que hizo No tiene tiempo para localizar a todos los siniestros en todos los lados, o (3) el resultado del incidente fue ambigua.

    
• Es necesario entender cómo los datos fueron creados. Esto es fundamental para entender los sesgos probables y debilidades en los datos. En particular, las normas de información de importantes acciones (SIGACT) ha cambiado drásticamente
    
con el tiempo y el procedimiento de información variada en todas las unidades. También hubo grandes cambios en la forma de los informes de las unidades iraquíes ha introducido los datos. En general, los datos tienden a ser más completa más adelante en la guerra, cuando las normas de información fueron más uniformes y la integración de información de las unidades iraquíes era mejor.

    
• Sólo examinar los incidentes que resultaron en bajas puede resultar en una visión muy sesgada de la guerra. Si un incidente violento causas víctimas, especialmente los civiles, tiene un componente aleatorio grande y por lo que debemos tener cuidado en las consecuencias que podemos extraer de este conjunto de datos reducidos.
Así, aunque las pinturas de datos un panorama sombrío, los hechos tienden a ser mucho, mucho peor, debido a la subdeclaración. Tenga cuidado al utilizar los datos - o por lo menos tener estas cosas en mente.

0 件のコメント:

コメントを投稿