科学データセットにコピペミスが蔓延している

https://www.sciencedetective.org/scientific-datasets-are-riddled-with-copy-paste-errors/

記事

  • 複数の科学データセットにコピペミスが広く存在。
  • 原因の多くはExcel手動編集+構造的QA不在。
  • ヒューマンエラーか意図的な改ざんかは判別困難。
  • データ共有プロセスに構造的な欠陥がある。

ディスカッション

  • 研究ごとにプロセスが異なりQA統一は困難との意見。
  • 仮説証明のプレッシャーが微妙なデータ操作を誘発する可能性。
  • コメント少なく、記事以上の実質的議論はなし。

HN(Hacker News)で議論を読む


原文(英語): Scientific datasets are riddled with copy-paste errors


Type Link
Added Apr 20, 2026
Modified Apr 20, 2026