Pholcus動態(tài)規(guī)則示例(翻譯)

特點(diǎn):動態(tài)加載規(guī)則,無需重新編譯軟件,書寫簡單,添加自由,適用于輕量級的采集項(xiàng)目

xxx.pholcus.html

<Spider>
    <Name>HTML動態(tài)規(guī)則示例</Name>
    <DeScription>HTML動態(tài)規(guī)則示例 [Auto Page] [http://xxx.xxx.xxx]</DeScription>
    <Pausetime>300</Pausetime>
    <EnableLimit>false</EnableLimit>
    <EnableCookie>true</EnableCookie>
    <EnableKeyin>false</EnableKeyin>
    <NotDefaultField>false</NotDefaultField>
    <Namespace>
        <Script></Script>
    </Namespace>
    <SubNamespace>
        <Script></Script>
    </SubNamespace>
    <Root>
        <Script param="ctx">
        console.log("Root");
        ctx.JsAddQueue({
            Url: "http://xxx.xxx.xxx",
            Rule: "登錄頁"
        });
        </Script>
    </Root>
    <Rule name="登錄頁">
        <AidFunc>
            <Script param="ctx,aid">
            </Script>
        </AidFunc>
        <ParseFunc>
            <Script param="ctx">
            console.log(ctx.GetRuleName());
            ctx.JsAddQueue({
                Url: "http://xxx.xxx.xxx",
                Rule: "登錄后",
                Method: "POST",
                PostData: "username=44444444@qq.com&amp;password=44444444&amp;login_btn=login_btn&amp;submit=login_btn"
            });
            </Script>
        </ParseFunc>
    </Rule>
    <Rule name="登錄后">
        <ParseFunc>
            <Script param="ctx">
            console.log(ctx.GetRuleName());
            ctx.Output({
                "全部": ctx.GetText()
            });
            ctx.JsAddQueue({
                Url: "http://accounts.xxx.xxx/member",
                Rule: "個(gè)人中心",
                Header: {
                    "Referer": [ctx.GetUrl()]
                }
            });
            </Script>
        </ParseFunc>
    </Rule>
    <Rule name="個(gè)人中心">
        <ParseFunc>
            <Script param="ctx">
            console.log("個(gè)人中心: " + ctx.GetRuleName());
            ctx.Output({
                "全部": ctx.GetText()
            });
            </Script>
        </ParseFunc>
    </Rule>
</Spider>

Tag:翻譯

<Spider>:蜘蛛???
<DeScription>:描述
<Pausetime>:停頓時(shí)間
<EnableLimit>:啟用限制
<EnableCookie>:啟用瀏覽器緩存
<EnableKeyin>:鍵盤錄入
<NotDefaultField>:不是默認(rèn)字段
<Namespace>:名稱空間
<SubNamespace>:次級名稱空間
<Root>:根
<Rule>:管轄
<AidFunc>:幫助Func
<ParseFunc>:解析Func

javascript:翻譯

param:參數(shù)
JsAddQueue():js添加隊(duì)列
GetRuleName():獲取管轄名稱
Output ():輸出

文章摘自:github /作者:henrylee

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容