
進入 Steemit 前,我便已涉足區塊鏈圈子好一段時間了。那時我主要在 Numerai 平台從事資料分析,藉由他們所提供的資料做預測來獲得獎勵。
Numerai 並沒有 ICO,但發行了名叫 Numeraire 的專屬代幣供大家擁有。不像其他項目要推出特殊產品給一般人,作為他們的營利來源,其僅提供資料而已。平台藉由綜合眾人分析完資料的結果,做出一個元模型,放到股票市場上運作。要是模型能夠表現良好,Numerai 就賺錢,它真正的營運機制是如此。
說明得更清楚點,他們接受大戶的投資,幫他們管理資產,但其有要求一定的門檻才能入資基金。據我所知,他們只接受最低10萬美元的機構投資(參考)。而 Numeraire 只有在參與預測時才有用,並不會給予回饋給持幣者,在這樣的情況下,單純持有並不會有特別利益,對於投資者而言沒有甚麼用。
大致來看,整個平台非常單純,其以獎勵招攬資料科學家,令他們幫 Numerai 預測。
我之所以到現在才介紹這個平台,是因為一兩個星期前有了大改版,獎勵系統做了些修正,對大家似乎更友善了;再加上,最近加密貨幣市場不是那麼熱絡,Numeraire 隨之變得比以往便宜,對於想以另一種方式獲得獎勵的人而言,門檻更低了(我稍後會解釋兩種獎勵機制)。於是想說,現在是個不錯的時候,可以將其推薦給大家,讓眾人也能從中得到好處。會資料分析、機器學習的人不妨去 Numerai 看看。
如何參與
只要有一個電子信箱帳號即可參與,填完資料後他們會把認證信寄給你,跟一般的網站一樣。當中比較特別的是,你可以在平台上用三組不同的電子信箱帳號作申請,每個都使用不同的模型去預測。但是記得,千萬不要超過這數目,他們這次大改版便有在處理多重帳號的問題,一旦被抓到,他們就會取消你的獎勵資格,將獎賞留給其他人。

依我來看,這對一般人而言有更大的誘因。原先 Numerai 只給前100名獎勵,而他者甚麼都領不到;但現今由於這個機制使得眾人得以遞補缺額,連兩百多名都有機會拿到,看來更公平了。
規則與介面介紹

登入後第一眼會看到這樣的介面,左上角是個人資訊,中間是記分板,記分板會記錄大家這回的上傳結果。Numerai 有四個重要指標審度參加者的預測結果,要是沒過門檻,它不會讓你進入實測,控制資金。這四個分別為:
- 對數損失函數值(Logloss)
- 穩定性(Consistency)
- 原創性(Originality)
- 一致性(Concordance)
Logloss 就是邏輯回歸的損失函數,用以衡量只輸出 0、1兩種結果模型的準確度,Numerai 要求預測結果必須小於 -ln(0.5)(也就是 0.69314718056 這個值),其意味著模型必須比隨便亂猜好。
穩定性用來衡量有多少個時間區塊,預測結果會小於先前提的 -ln(0.5)。指標以比例來呈現,其要大於等於75%,也就是說模型需經得起時間的考驗,不論在何種狀況下偏差也不要過大,不能過度調適(Overfitting)。
原創性是避免大家皆使用相同模型,上傳同樣的預測結果,造成元模型單一而無法提升準度所設計的指標。上傳後,平台會檢查是否與他人結果有類似之處,要是被演算法認為類似,就需要重新設計模型再次提交。有時,大家會因此而遭遇困難,必須想辦法與他人不同才行。
一致性是說提交的結果是否皆使用相同的模型來預測,一般而言,很難被判定為不一致。
Numerai 每星期為一回合,時間到後便會關閉,進入下一回合預測。封盤後,需耗時一個月的時間,在股市上實際測試,爾後才公布結果。參與者會依在市場上的表現而有不同獎勵,詳細獎勵明細請參考這個表格。
資料大觀

Numerai 提供的資料僅有數值而未說明變數資訊,完全仰賴資料分析,讓模型自行去尋找變數與結果間的聯繫,排除人為標記的可能。在大改版前,變數只有21種,而現在一口氣增加至50種。
而資料如以往一樣,經過他們團隊處理,皆呈常態分布。

訓練模型完,就將他們提供的預測資料填上機率,然後上傳至平台檢測,參與者要做的就是這些事。

下載下來的檔案有他們提供的R語言及 Python 範本,所以不用擔心整個輸入輸出流程為何,有問題便可參考他們的代碼。
下注制度
獎賞分為兩種,一種是你提供預測的獎勵,就算表現不佳也不會被懲罰,也就是先前不斷提到的獎勵;另一種是下注,你把 Numeraire 押住在自己身上,保證自身的實測結果低於 -ln(0.5)。若是不成,下注的代幣則將銷毀,需要承受損失。
下注系統有兩個參數需要考慮:下注額和信心值。下注額顧名思義表示下注的金額(最少1 Numeraire),而信心值則表示對於結果能否通過的信心程度。但信心值不單只有如是意義而已,其跟下注所得的回報(以美元計)有關。回報的公式如下:
下注額固定而信心值越小,回報越高。
但信心值並非越小越好。獎池有一定金額配給,一共3000美元,信心值越高領取順位越高,會不斷派發下去直到領完為止。
最底下的人通常拿不到任何獎勵,因為前面的人早已提領一空。想避免獎勵太少又不願平白蒙受風險,信心值的選擇對於下注者而言是很重要的一件事。
記得,下注有一定風險,不一定每次模型都能相當順利通過考驗。就好比這回合:

當時整個參加者的預測結果都很差,甚至於沒什麼人通過 -ln(0.5) 檢驗。即因這件事的關係,Numerai 有了大改版,將一些機制修訂,提供更多的資料給大家,為的就是避免這事再發生。
獎勵提領
倘若你成功進入100名或賭贏的話,他們會匯入一筆獎勵(前者有美元和 Numeraire,後者為美元)進你的帳號。而 Numerai 提供 Numeraire 和以太幣兩種管道提取,不收手續費。
邀約
除開在 Steemit 寫作外,你也可以在 Numerai 賺點外快,作為另一種收入來源。或許就寫作的同時,順便訓練模型。
我個人認為訓練模型上傳資料,沒甚麼太大問題,若非下注,不然不會牽扯任何金錢問題,就算 Numerai 倒了也不會被影響。自身的智識還是自己的,不是嘛?
在此,我邀請所有人前來 Numerai 參與這盛會。
老實說,彼此並不完全是競爭者,也可以是合作者的關係。為了讓 Numerai 繼續營運下去,而共同去研究模型,相互砥礪。
倘若自身不會資料分析也沒關係,吳恩達教授的機器學習永遠為你敞開,學完後就可以上工了!