Slingshotで保存される貴重なデータセット
訳注:データセットとは、データのまとまり或いはシンプルにファイルの事
この2週間でFilecoinコミュニティはFilecoinネットワーク上の20万件以上のストレージ取引を通じて170TiB以上の貴重なデータを保存しました。これらデータは、Slingshot競争の参加者であるストレージクライアントや開発者がFilecoinネットワーク保存したものです。
私たちは、科学、文化、エンターテイメント、ソフトウェアなど、さまざまなデータセットを中心に、各チームがDropboxスタイルのストレージアプリ、ゲーム、UIを作成しているのを見てきました。Slingshotでこれまでに見た中で最も興味深いデータセットをいくつかご紹介しましょう。
「スマートシティ」チーム
データセット:光ファイバデータ
データサイズ:~50-100 TiB
Smartcityは、敷設された光ファイバーケーブルから生成されたデータを利用して、世界中の都市の光ファイバー周辺の温度、圧力、振動、音などの情報を監視するセンサーベースのネットワークとデータ解析システムを構築しています。このデータは、研究者や自治体の管理者、交通施設の管理者などが都市計画や建設の支援に利用することができます。また、予測監視システムの構築や、場合によっては地震の予測にも利用できます。これらのケーブルは、都市の神経システムのようなものです。Smartcityプロジェクトでは、この生成されたデータを利用して、都市の効率的な運営を支援しています。
光ファイバーセンサーネットワークからのデータは、FilecoinとIPFSに保存されます。ディープラーニングモデルはこのデータ上で訓練され、最終的には様々な信号の種類を分析し、パターン認識によりイベントを分類・予測するために使用される予定です。チームは、これらのセンサーから収集した音を再生するためのウェブページを作成したほか、これらのファイルをIPFSとFilecoinからディープラーニング処理を実行するリモートのウェブサーバーに送信するためのクエリインターフェイスも作成しました。
「Zangshell」チーム
データセット:バーチャルリアリティデータ
データサイズ:~50 TiB
Zangshellは、特殊なカメラからオリジナルの映像を収集し、そのデータを加工して保存したバーチャルリアリティ(VR)・拡張現実(AR)システムです。元々は不動産業界や自治体のエンジニアリング業界向けのデータとして利用されていました。これまでこのデータは集中管理されたデータセンターに保管されていましたが、チームは保管コストを節約するためにIPFSとFilecoinのネットワークにデータを移行しています。Zangshellチームは、ストレージとデータ処理パイプラインをIPFSとFilecoinに直接移行する予定です。
Zangshellのユーザーは、これらのVR/AR画像や動画をWebブラウザで直接見ることができるようになります。ユーザーは、画像のズームインやズームアウトができ、また、PCのマウスやモバイル画面上のジェスチャーを使用して、さまざまな角度から仮想現実のシーンを見ることができます。
「雲南の星空」チーム
データセット: 天文・気象データ
データサイズ:~200TiB
雲南の星空チームは、天文・気象データのチャート、分析、写真などのリポジトリを保存しています。データは、中国の昆明にある雲南大学によって生成、収集、保存されています。雲南の星空チームは最近、この大学といくつかの異なるプロジェクトで協力しており、このデータをFilecoinに保存することについて議論しました。Slingshotの発表は、彼らにこの新しいプロジェクトをスタートする良いタイミングでした。
またチームは、このデータが将来の世代に役立つと考えており、人類の最も重要な情報を保存するというFilecoinの使命とストレージネットワークが、このデータの保存に適したソリューションにしていると見ています。彼らは、大学のメンバーや天文データや気象データを扱う他の組織を最初のユーザーとして迎えることを計画しています。
その他の貴重なデータセット
Slingshotチームが特定のユースケースのために保存しているデータセットに加えて、保存することを推奨している複数の重要且つ一般公開されているデータセット*があります。これらのデータセットは、世界中のユーザーに重要な医療、科学、文化の情報を提供できる可能性があります。これらのデータセットには以下のようなものがあります。
* https://github.com/filecoin-project/slingshot/blob/master/datasets.md
宇宙データ
スローン・デジタル・スカイ・サーベイ(SDSS)*は、宇宙の詳細な3次元地図を作成しており、深みのあるマルチカラー画像と300万個以上の天体のスペクトルを特徴としています。SDSSは20年以上にわたって宇宙地図の作成に取り組み、データの追加を続けています。このデータを使って、新しいタイプのクェーサーの発見、天の川の周りを回る「超微弱」矮小銀河の発見、銀河系の中心ブラックホールに近づきすぎて、天の川から完全に脱出してしまうほどの速さで移動している「超速星」のデータなど、すでに新しい発見がなされています。
* https://www.sdss.org/science/
COVID-19のデータ
米国政府と主要な研究グループの連合は、公開されているCOVID-19オープンリサーチ・データセット(CORD-19)*を準備しました。SARS-CoV-2および関連するコロナウイルスに関する20万件以上の学術論文です。このデータセットにより、世界の研究コミュニティはCOVID-19との戦いを支援し、将来のパンデミックを防ぐための新たな洞察を生み出すことができるようになります。
*https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
博物館データ
台湾国立故宮博物院は、政府のデータの質を向上させ、教育用、個人用、商業用に利用できるようにするため、2015年に「データベース検索」と「画像ダウンロード」のリポジトリを公開し、博物館の画像や研究資料をより一般の人が利用できるようにしました。このデータには、展示情報のほか、絵画、古美術品、衣類、碑文、書道などの博物館の遺物の画像が含まれています。
*https://theme.npm.edu.tw/opendata/index.aspx?lang=2
私たちの世界では毎日、膨大な量のデータが生み出されています。これらのデータの多くは、人類の最も重要な疑問に答えるのに役立つ可能性を秘めています。私たちは、Filecoinネットワークが、私たちの人類としての種のデータを確実に保存し、将来の世代がアクセスできるようにすることで、大きな問題に対処する上で貴重な役割を果たすと信じています。Slingshotの参加者が協力することで「可能性」に達成することを期待しています。
※当記事については、ご参考情報となります。正確性・真実性確認にはご自身で情報ソースを確認して下さい。
また、Protocol Labs公式からの情報更新を翻訳しております。
そのため、記事発行時点の内容のため、後日に内容が変更される可能性があります。
更新情報は速やかに公表させていただきます。
※発信元
コメント