職位類型:數據挖掘工程師
招聘公司:搜狐(搜狐官方招聘)
筆試時間:2015校招
以下題目是我能回憶起來的筆試內容。我不記得是不是有 A、B 卷之分,但以下內容都被考察過無疑。筆試題目范圍非常廣泛,涉及機器學習、網絡編程、hadoop、C++、多線程和智力題。
1.小白鼠喝毒水問題。
2.hadoop 在 HDFS 上文件存儲的默認冗余參數是3。
3.兩個線程同時累加一個全局變量,比如利用 for 循環進行 50 次自增操作,問該該全局變量的最終結果范圍。
4.TCP 的三次握手,四次揮手。
5.關于 TCP 雙方關閉連接,涉及到 TIME_WAIT 的概念。
6.SVM、條件隨機場、隱馬爾科夫模型、最大熵模型中,哪個是生成式模型?應該是隱馬爾科夫模型1。
7.還是以上四個模型,哪個模型不符合凸模型 有全局最優解的條件?應該還是隱馬爾科夫模型。
8.貝葉斯網絡是有向無環圖。
9.分詞中最大正向匹配,最大逆向匹配的概念。
10.linux 平臺下有一個三列文件,列之間用逗號分隔,請編程對第二列數字求和。
11.左值不能賦值。
12.hadoop 默認 block 大小是 64M,JobTracker 和 NameNode在同一臺機器上。
13.hadoop 采用 Combiner、采用壓縮率高的文件格式以及在 map 過程中去掉無效數據都是為了減少數據傳輸量,與這些優化方法不同的是優化 Partitioner,因為它是為了均衡數據量,而非減少數據量。
14.熵的計算公式和熵最大的條件。
15.復雜鏈表的復制,所謂復雜是指一個節點除了指向后繼,還隨機指向鏈表中的一個節點或 NULL。
16.問如下代碼的輸出,其實就是統計二進制表示中 1 的個數。
int a = 9999;
int count = 0;
while(a) {
??? count? ;
??? a = a & (a-1);???????????????
?? }
?? cout<
沒有完整題目和答案,能力有限,只能做到這樣了,希望能對大家多少有點幫助。最后對要應聘這個崗位的同學們說聲Good Luck!