? ? ?最近有一個(gè)goood idea,想把電影網(wǎng)站中能用迅雷下載的鏈接用程序給爬下來,分別對(duì)應(yīng):電影名稱 下載鏈接 IMDB或豆瓣的評(píng)分,優(yōu)先取IMDB評(píng)分,沒有再取豆瓣評(píng)分,為了提高電影質(zhì)量,篩選的都是8.0分以上的,低于8.0或者沒有評(píng)分的不入庫,傳說IMDB評(píng)分8.0以上的都是非常值得看的,9.0以上的稱謂"神片",至于IMDB(Internet Movie Database )的評(píng)分我認(rèn)為還是比較公正的,是使用貝葉斯統(tǒng)計(jì)的算法加權(quán)算出來的,哈哈,后續(xù)有時(shí)間深入學(xué)習(xí)一下該算法,當(dāng)然也存在漏網(wǎng)之魚,沒評(píng)分的或者服務(wù)器沒反應(yīng)的時(shí)候也不乏存在好電影
接下來是程序的過程
1、先說要做的事情,上面也有簡(jiǎn)介過,爬取該界面的>8.0評(píng)分的電影......http://www.dytt8.net/html/gndy/dyzz/list_23_1.html

2、先設(shè)計(jì)數(shù)據(jù)庫(moveId moveName moveLink moveScore),其中moveId是自增,如圖所示:

3、創(chuàng)建一個(gè)Maven項(xiàng)目,并配置pom.xml文件,因?yàn)樵摽蚣苣阋淮笈懙摹?。所有要配置該引用?xiàng)目,如圖所示:

4、moveLink文件是爬蟲邏輯
moveInfo是實(shí)體類對(duì)應(yīng)的表結(jié)構(gòu)
moveUtil是對(duì)數(shù)據(jù)庫的一些操作,其中數(shù)據(jù)庫配置信息存放在源程序的這個(gè)位置
其中java操作數(shù)據(jù)庫,需要一個(gè)jar包


程序源碼:https://github.com/zhangzichao11/Android_Move