2010年10月27日水曜日

ウィキリークイラク:どのようなデータが間違っている?2010年10月25日 ガーディアン新聞 ウィキリークの米軍秘密情報暴露

Wikileaks Iraq: what's wrong with the data?

How reliable is the Wikileaks Iraq data? An insider explains its limits
How data journalism mapped Iraq's deaths



2010年10月25日 ガーディアン新聞 ウィキリークの米軍秘密情報暴露
ウィキリーク イラク:どのようなデータが間違っている?

どのように信頼性の高いWikileaksは、イラクのデータですか?インサイダーは、その限界を説明する•データのジャーナリズムは、イラクの死をマップする方法
イラク戦争が死亡、グラフィックWikileaksは、イラク戦争は、死がマップログマップログに記録します。マップを取得
Wikileaksはイラクの膨大なデータのリリースでは、この週末のニュースを支配している。また、データの膨大な質量を探索する我々の努力の一環として、我々は記録ごとに死をマッピングされます。
これは、最大の一つである - そして最も敏感な - データセットは、これまでにリリースされるし、それは実際にイラクで何が起こったかを見つけることに興味がある人のための情報の巨大なソースを提供します。シニフィアンアクション - - バージョンでは、いくつかの学者は、しばらくの間、米国では分析して販売されており、正式にSIGACTSデータベースとして知られています。
私たちにそれが照合された方法に魅力的な洞察力を与えているデータベースの一部と協力して一つ。データベースは我々のマップのみを選択死によって、私たちはさらに大きな画像を失われることが膨大であり、プリンストン大学でヤコブシャピロ氏は、政治の助教授と国際言います。彼はSIGACTS 3つの主要な問題を指摘している:

    
•これは、"すべての死"か何かそれに近いされていません。これは、多国籍軍イラクによって記録されたすべての死である。を含むいくつかの理由でこれらのデータにも過少申告です:(2)連合、地域のイラクユニットはしなかった戦闘のような高いレベルに従事していた(1)死を記録するための前後には連合やイラクのユニットがあったすべての側面上のすべての犠牲者を追跡する時間がある、または(3)事件の結果はあいまいでした。

    
•1つのデータが作成された方法を理解する必要があります。これは、データの可能性バイアスと弱みを理解するために重要です。特に、重要なアクション(SIGACT)の報告基準が劇的に変化
    
時間とユニット間で変化報告手順で。イラクのユニットからのレポートデータを入力する方法に大きな変化もあった。一般的に、データが報告基準は、より均一したときイラクのユニットからの情報の統合が優れていた戦争の後半で完了する可能性があります。

    
•のみが犠牲になった事件は、戦争の大きく歪曲されたビューで可能性があります確認。暴力事件は、死傷者、特に民間のものは、原因かどうか、および大規模な無作為のコンポーネントを持つように、我々はこの減少データセットから描くことができます推論には注意する必要があります。
したがって、データ塗料険しい画像が、事実は、過少申告のために、はるかに、はるかに悪化する可能性があります。あるいは、少なくとも心にこのようなものを負担する - データを使用する方法に注意してください。

0 件のコメント:

コメントを投稿