←前の記事 次の記事→

【NMR】Numeraire(ニューメライア)

機械学習アルゴリズムを用いて効率的な市場取引を行うヘッジファンド。


Translate this article in English

【NMR】Numeraire(ニューメライア)
Numeraire

通貨名(通貨単位):Numeraire(NMR)

最大供給量:2,223,451 NMR

現在の供給量(記事作成時):1,223,451 NMR

システム(アルゴリズム):-

公開日:2015年12月1日

公式サイト:https://numer.ai/

ソースコード:-

Blockchain Explorer(取引詳細):https://etherscan.io/token/0x1776e1F26f98b1A5dF9cD347953a26dd3Cb46671

ホワイトペーパー:https://numer.ai/whitepaper.pdf

Bitcointalk(フォーラム):https://bitcointalk.org/index.php?topic=1984569.0

公式フォーラム:https://forum.numer.ai/

CoinMarketCap(チャート):https://coinmarketcap.com/assets/numeraire/

(本文前に)簡単な3行まとめ

  • 機械学習による効率的な取引を行うヘッジファンド。
  • 高品質の株式市場データは、データ独占およびヘッジファンドによって保護されている。
  • ディープラーニングによって市場データが共有されれば大きな効果をもたらす。

概要

データ科学者のネットワークによって構築された新しい種類のヘッジファンド。(Getting Started With Folding)

機械学習アルゴリズムの進化

ここ数年、機械学習アルゴリズムはコンピュータビジョンの大きな問題を解決しました。

このような問題の1つは、MNISTデータセットの手書き数字を認識する方法を学習するアルゴリズムを取得することでした。

誰もがパターンの異なる数字を書き込むため、コンピュータが把握するのは困難でした。

データセットが1998年に初めて利用可能になったとき、コンピュータビジョンの機械学習アルゴリズムはあまり正確ではありませんでした。

さらに、コンピュータハードウェアは今日のところでははるかに遅れていました。

しかし、ゆっくりと、世界中の研究者によって進歩しました。

2012年までには、研究者は手書き桁認識に近い人間のパフォーマンスを示す機械学習アルゴリズムを発表しています。

MNISTを利用すれば誰でもデータセットをダウンロードして進歩に参加することができるため、世界中の人々が参加しました。

彼らはアルゴリズムを訓練し、新しいアイデアを試すのに必要なデータを持っていました。

オープン参加がなければ、コンピュータはまだ手書き数字を認識することができない場合があります。

効率的な市場における進歩

株式市場の効率性ははっきりとしたものではありません。

非効率性は社会に悪いです。

資本が正しく配分されると、世界全体に利益がもたらされます。

それは非常に重要ですが、困難な問題でもあります。

そのため、株式市場データセットがあれば、それを解決するために進捗グラフがあれば、それは効率的なものとなります。

資産運用会社やヘッジファンドは、機械学習のスキルを持つ人材を雇用することができ、彼らは間違いなくGPUを買う余裕があります。

しかし株式市場に欠けているのはオープンな参加です。

個人がこれまで以上に多くの市場データにアクセスできるように見えるかもしれません、例えばYahoo!のような多くの無料のファイナンスデータソースのようなものです。

しかし、驚くべきことに、ほとんどの株式市場データは公開されていません。

Yahoo!のみを使用するモデルを構築する財務データは、画像内の1つのピクセルのみを使用して、手書きの数字を認識することを習得するのと同じです。

高品質の株式市場データは、データ独占およびヘッジファンドによって保護されています。

独占者はそれだけで楽しむことができ、情報のあるヘッジファンドはそれにオープンに参加することはありません。

インセンティブは、高品質のデータセットが時間とともに秘密になり、より高価になっていきます。

したがって、MNISTのコンピュータビジョンの問題とは異なり、株式市場の解決は目に見えない状態で起こることはありません。

株式市場については、機械学習のための無料で高品質な公開データセットは存在しません。

アルゴリズムのトレーニングデータがなければ、ウォールストリートで仕事をしていないデータ科学者は、より効率的な市場への進展に参加する方法がありません。

この状況は、データサイエンスの分野が、TheanoやTensorFlowなどの自由に利用できるツール、安価なクラウドコンピューティングリソース、統計学習の要素などの無料の書籍、Kaggleのような機械学習コミュニティ、Andrew NgのCourseraコースのようなMOOCs等、民営化によってますます民主化されていると考えると、非常に残念な結果です。

これまでにフィールドがアクセス可能になったことはありません。

人工知能のブレークスルーはどこからでも来る可能性がありますが、株式市場に関しては、データを共有する方法を見つけることができない限り、その可能性は低いでしょう。

共有のためのブレークスルー

高価な市場データを自由に安全に利用できるようにする方法があればどうしますか?

暗号化はデータを保護する方法です。

通常、データを暗号化すると、データ科学者にとって無用になります。

しかし、暗号技術の新たな進展により、データ・サイエンスに対する実用性を損なうことなく、データセットを安全に共有できるようになりました。

構造を保存する暗号化方式により、機械学習アルゴリズムは未処理のデータに対して盲目であっても学習することができます。

現在、FanやVercauteren方式などの実用的な準同型暗号化方式があり、代数的リングにおける高次多項式暗号文に対する加算演算や乗算演算を実行できます。

もし乗算と加算が保存されていれば、構造も同じです。

機械学習アルゴリズムは構造のみに関心があるため、この画期的なことは、暗号化されたデータに対して機械学習アルゴリズムを実行できることを意味します。

順序を保存する対称暗号化のような簡単なスキームも、特定の設定でセキュリティを提供します。

神経暗号からの新しい方法を使用して、マシンの学習ツールですぐに使用できるデータを暗号化することができます。

ニューメライ

過去2年半にわたり、150億ドルを持つ資産管理会社で多くの情報源からの高価な財務データを使って作業していましたが、小さなデータセグメントを扱いにくいバイナリ分類問題に変える方法を考え出しました。

そして私は、このデータの機械学習アルゴリズムを作成し、訓練することができました。

私のモデルを使用して、私たちは1年以上にわたって約5,000万ドルを投資し、市場を大幅に上回りました。

誰もが幸運を得ることができますが、機械学習アルゴリズムを測定する際に正しい方法で行うのは簡単ではありません。

私たちはYann LeCunがMNISTを解決するのを手助けしたときに幸運にはならなかったことを知っています。

ただ、上手く作動する金融モデルが機能すれば、あなたはそれを使ったテクニックを隠し、データを改善するために使用したメソッドを非表示にするでしょう。

そして最も重要なのは、データを隠すことです。

秘密による財政的インセンティブは強いです。

しかし、準同型暗号について学んだとき、暗号を使って私のデータセットを他の機械学習の専門家と共有する方法を見つける意欲がありました。

データを共有することができれば、他の人がいつか私のモデルよりも優れたモデルを構築できると私は信じていました。

そこで私はニューメライ(Numerai)を始めました。

最初のヘッジファンドは、構造を保存したまま暗号化してデータを無料で提供し、世界中のデータ科学者がオープンに参加することができます。

私たちはプロジェクトを2015年12月1日に立ち上げました。

Elon MuskとSam Altmanの10億ドルのOpenAIプロジェクトに奪われるまで、私たちはr / machinelearningのトップに上がりました。

そして10日以内に、バンガロールの大学院生がニューラルネットワークを背景に私のモデルを打ち負かしました。

数日後、ポーランドのユーザーがニューメライに関するブログ記事を公開し、Googleプラットフォームを開始するための無料コードを公開しました。

それ以来、スタンフォード大学、ハーバード大学、カーネギーメロン大学、バークレー校、インド工科大学、ケープタウン大学の教授と学生がデータをモデル化しています。

ウォールストリートでアナリストとして働くユーザーがいます。

有名な定量ヘッジファンドで働くユーザーがいます。

GoogleとMachine Intelligence Research Instituteのユーザーサポートベクターマシン、XGBoost、ディープラーニングアルゴリズムを使用するユーザートップ100、トップ50、トップ10のKaggle Mastersのユーザーがいます。

それらは全て103か国のユーザーにわたります。

最初の1ヶ月間にはニューメライのユーザーは10,292件の予測セットをアップロードしました。

これは合計200,098,002件の株価予測です。

私はニューメライがそれに追いつくのにずっと時間がかかると考えましたが、私たちのユーザーはニューメライの暗号化された株式市場データセットのエラー率を大幅に下げています。

DEEPAIは最初の大きなストライドを行い、DATAGEEKは12月に他のどのユーザーよりも低いエラー率を達成しました。

それ以来、ユーザーが新しいアイデアを試して新しい技術を発見するにつれて、エラー率は低下し続けています。

今月最高ランクのユーザーの1人は、今年のモントリオールで開催されたNeural Information Processing Systemsカンファレンスで学んだ最先端の研究を利用しています。

ニューメライは現在、当社のヘッジファンドであるNumerai Fund 1、LPのユーザー生成予測を用いて取引しています。

▲ サイト最上部へ移動 ▲