職位描述
崗位職責:
1、對百度CDN PB級別數據進行離線、實時處理;
2、基于Hadoop、Spark、Storm設計并實現大規模機器學習算法;
3、參與大規模數據服務平臺架構的系統設計、實現和調優;
任職資格:
1、較好的數學基礎和算法基礎;
2、熟練掌握一門以上編程語言(Java/Python/Scala/C&C++),熟悉Linux開發環境;
3、熟悉主流分布式處理框架——Hadoop、HBase、hive、Kafka等,掌握MapReduce、Storm或者Spark編程。
4、熟悉機器學習的基本理論,了解常見機器學習算法;
5、熟悉分布式開發環境,熟悉多線程及并發技術,熟悉網絡編程
6、有較強的分析和解決問題的能力;
7、有持續學習新知識的能力和意愿,善于溝通和邏輯表達,優秀的團隊合作意識,積極主動。
企業介紹
百度,全球最大的中文搜索引擎、最大的中文網站。2000年1月創立于北京中關村。
百度擁有數千名研發工程師,這是中國乃至全球最為優秀的技術團隊,這支隊伍掌握著世界上最為先進的搜索引擎技術,使百度成為中國掌握世界尖端科學核心技術的中國高科技企業,也使中國成為美國、俄羅斯、和韓國之外,全球僅有的4個擁有搜索引擎核心技術的國家之一。
從創立之初,百度便將“讓人們最便捷地獲取信息,找到所求”作為自己的使命,成立以來,公司秉承“以用戶為導向”的理念,不斷堅持技術創新,致力于為用戶提供“簡單,可依賴”的互聯網搜索產品及服務,其中包括:以網絡搜索為主的功能性搜索,以貼吧為主的社區搜索,針對各區域、行業所需的垂直搜索,Mp3搜索,以及門戶頻道、IM等,全面覆蓋了中文網絡世界所有的搜索需求,根據第三方權威數據,百度在中國的搜索份額超過80%。