河南夢之網網絡科技有限公司
夢之網科技出品
掃描關注夢之網科技微信公眾賬號

掃小程序碼聯系客服

我要這金牌有何用:Kaggle 競賽成績真能“保送”谷歌、FB 嗎?-夢之網科技

夢之網科技?2019-10-12?文章動態?

參與:李澤南、鄭麗慧

那些在 Kaggle 上獲得金牌的數據競賽大神們都找到了好工作嗎?現實或許沒這么美好。

對于初入機器學習領域的人來說,你肯定已經從學長口中、博客文章中、社區帖子里聽說過 Kaggle 的大名。除了大量競賽以外,Kaggle 上也有很多公開的數據集。

有很多 Kaggle 入門教程都會提到:這是一個在業內擁有很高認可度的競賽平臺,在你的簡歷中附上 Kaggle 成績,會對找工作很有幫助。

最近,這一問題在 Reddit 機器學習板塊上引發了熱烈討論。

我要這金牌有何用:Kaggle 競賽成績真能“保送”谷歌、FB 嗎?-夢之網科技

發帖者「u / AlexSnakeKing」輾轉反側:在大家眼中,Kaggle 獎項的重量足以讓你「走上人生巔峰」。我們經常可以看到各路 Kaggle 大神的傳奇經歷,他們有的非常年輕,有的身經百戰。而故事的結局通常會是:他們獲得了谷歌、Facebook 這樣科技巨頭的青睞。

但他也觀察了自己在博客上關注的很多 Kaggle 獲獎者,還有一些經常在 LinkedIn 上聯系的獲獎者。獲獎的幾個月后,「朝為田舍郎,暮登天子堂」的故事沒有發生,這些獲獎者并未出現在 谷歌、FaceBook 的辦公室里,甚至還有一部分人始終處于自由職業者的狀態……

這正是令「u/ AlexSnakeKing」迷惑的地方,Kaggle 上的好成績真的會對求職有幫助嗎?

直白點說,在 Kaggle 上得獎能不能幫我們拿到 Google、FB、Open AI 這些大廠的 offer?

機器學習界的「耶路撒冷」

作為最著名的數據科學競賽平臺,Kaggle 成立于 2010 年,并于 2017 年被谷歌收入旗下。迄今為止,這一平臺上已經舉行了 356 場各種類型的數據競賽。

很多公司、政府研究機構都會把自己的數據放上來,開放給全球范圍內的參賽者,讓他們幫助自己建模型。為了提高參賽積極性,他們也會設置一定的獎金,用來獎勵模型精度最高的幾個隊伍,有些競賽的獎金甚至可以高達百萬美元。

于是乎,Kaggle 源源不斷地吸引了成千上萬的開發者來參加競賽,許多數據科學家在 Kaggle 上投入了大量的時間和精力。在諸如機場安全、衛星數據分析這類的任務上,不乏數十年經驗的優秀團隊加入比賽。

在機器學習愛好者們心中,Kaggle 是一個燈塔般的存在。

我要這金牌有何用:Kaggle 競賽成績真能“保送”谷歌、FB 嗎?-夢之網科技

Kaggle 的總榜單上現在已經出現了 162 名大師級(Grandmaster)選手。而在所有比賽中,獲得金牌的人數大約占總人數的 2.5%。然而,數量多并不意味著拿獎牌的幾率很高:從趨勢上看,隨著參與人數的逐漸增多,獲取 Kaggle 獎牌的難度正在逐年提升。

Kaggle 獎牌能讓你成為 offer 收割機嗎?

「贏得 Kaggle 不代表就是一名好的 ML 工程師」

兩枚銀牌得主「cpury」表示:

我不是金牌獲得者,但是在自身領域也得過兩枚銀牌。其實得 Kaggle 的獎還是有用的,很多 Kaggler 在 Linkedin 上加我,面試的時候這段經歷也經常會被提到。就算搞自由職業時,這也是你談價格的籌碼。

你可以說,我值這么多錢,因為我在 Kaggle 上解決過一個類似的問題,并且排在前 100 位。

我也贊同,在 Kaggle 上做得好不代表就是一名好的 ML 工程師,Kaggle 太過關注純數據科學,尋找創意集合體,然后花費大量時間(或者你還要花很多錢)進行實驗,同時盡可能減少過擬合。對于競賽而言,最好的模型就是能夠供整個社區使用,你的主要任務也是做到這點。

「Kaggle 不會主動帶來大廠 offer,但非常有用」

在 kaggle 比賽中得過兩次前三的網友「juliandewit」說:

我現在就是一名自由職業者,職業方面還不錯。Kaggle 確實給我帶來了一些不錯的資源和回報,我也經常收到創業公司的邀請,這還是在我沒有推銷自己的前提下。

不過沒有 Google/OpenAI/Facebook 的邀請,也沒有天價薪酬。

我個人覺得你應該在 Kaggle 上多努力,如果說是為了找工作,Kaggle 是不會為你自動帶來 offer 的,但是一個好的 Kaggle 成績當然非常有用。

「想成為優秀的工程師,重在實踐」

還有一位網友建議發帖者更關注實踐經驗:

首先我覺得這個取決于你參加比賽的類型。

在我(有限)的 Kaggle 經歷中,我發現那些獲獎者很少擁有最佳模型。如果模型要通過準確性得分/ AUC 進行評估,可以說前 10 名團隊的得分都會大于 99.5%。你知道,這些模型大部分都被遺忘了。

所以我覺得贏得 Kaggle 比賽不一定會讓你成為優秀的 ML 從業者。不錯,接近完美的準確性是很好,但如果暴露在真實數據中時完全癱瘓,那就不是一個成功的模型。

網友「Nitro_V」也贊同這一觀點,同時補充了自己的觀點:

文章關鍵詞
急速赛车国语 赚钱的工作技术 女人代理什么赚钱 加盟盐津铺子赚钱吗 开个分享群能赚钱吗 在平台赚钱再到平台上消费 梦幻西游法宠手游赚钱 赶会卖东西赚钱吗 手游热血江湖能赚钱么 那个师傅带赚钱 在什么直播软件最赚钱 微信里卖什么最赚钱 天天基金怎么赚钱 赚钱网游2016 熊市中可以赚钱么 网店几块钱的东西能赚钱吗 广州赚钱的行业分析