職位描述
工作職責(zé):
1.編寫抓取互聯(lián)網(wǎng)內(nèi)容的爬蟲。
2.數(shù)據(jù)抽取核心算法的編寫與優(yōu)化,提升爬蟲抓取效率和質(zhì)量。
3.抓取策略算法的更新維護(hù),以及確保數(shù)據(jù)抽取準(zhǔn)確、高效。
任職資格:
1.理工科專業(yè),本科以上學(xué)歷。
2.熟悉多線程、多進(jìn)程、網(wǎng)絡(luò)通信編程相關(guān)知識;
3.有java平臺(tái)下網(wǎng)絡(luò)爬蟲開發(fā)經(jīng)驗(yàn),熟悉scrapy,WebMagic爬蟲框架,selenium動(dòng)化測試及phantomJS;
4.熟悉JavaScrip、HTML、XML、CSS技術(shù),熟悉網(wǎng)頁抓取原理及技術(shù),熟悉正則表達(dá)式,從結(jié)構(gòu)化的和非結(jié)構(gòu)化的數(shù)據(jù)中獲取信息;
5.具有團(tuán)隊(duì)合作精神,有責(zé)任感,對工作認(rèn)真負(fù)責(zé),有較強(qiáng)的協(xié)調(diào)和溝通能力。