可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請?zhí)砑観Q:3230981406 微信:aopopenfd777
21春學期(1709、1803、1809、1903、1909、2003、2009、2103)《網(wǎng)絡爬蟲與信息提取》在線作業(yè)
試卷總分:100 得分:100
第1題,下列說法錯誤的是()
A、小程序的請求極其簡單,基本上沒有驗證信息
B、用Python來請求小程序的后臺接口從而獲取數(shù)據(jù),比請求異步加載網(wǎng)頁的后臺接口要復雜很多。
C、如果目標網(wǎng)站有微信小程序,那么一定要優(yōu)先調(diào)查能否通過小程序的接口來抓取數(shù)據(jù)。
D、小程序的反爬蟲能力比網(wǎng)頁版的低很多。使用小程序的接口來爬數(shù)據(jù),能極大提高爬蟲的開發(fā)效率。
正確答案:
第2題,()是一個傳遞信息的通道。它負責將爬取博文列表頁獲取到的信息傳遞給負責爬取正文頁的方法中。
A、meta
B、head
C、header
D、body
正確答案:
第3題,啟動MongoDB使用命令mongod --() usr/local/etc/mongod.conf
A、config
B、install
C、start
D、begin
正確答案:
第4題,HTTP常用狀態(tài)碼表明服務器不允許訪問那個資源的是()
A、500
B、503
C、403
D、405
正確答案:
答案來源:(www.),Python正則表達式模塊的findall方法如果沒有匹配到結果,則返回結果為()
A、空
B、空列表
C、空元組
D、不返回
正確答案:
第6題,Scrapy中使用Xpath獲得的結果調(diào)用了.extract方法,結果以()形式生成
A、列表
B、元組
C、字典
D、集合
正確答案:
第7題,在Scrapy的目錄下,哪個文件負責數(shù)據(jù)抓取以后的處理工作?()
A、spiders文件夾
B、item.py
C、pipeline.py
D、settings.py
正確答案:
第8題,Python在Windows路徑字符串左引號的左邊加()符號來避免反斜杠問題
A、s
B、c
C、d
D、r
正確答案:
第9題,python中可以用來將圖片中的文字轉換為文本的第三方類庫是
A、lxml
B、requests
C、beautifulsoup
D、pytesseract
正確答案:
答案來源:(www.),在Linux中哪個命令是添加權限的()
A、chmod
B、sudo
C、cp
D、mkdir
正確答案:
第11題,使用python定制mitmproxy,下面的語句請求的是()。{req.headers["User-Agent"]}
A、headers
B、文本內(nèi)容
C、目標網(wǎng)站
D、user-agent
正確答案:
答案來源:(www.),PyMongo中邏輯查詢表示小于等于的符號是()
A、$gt
B、$lt
C、$gte$$lte
正確答案:
第13題,Python中若定義object=[1, 2, 3, 4, 5],則print(object[-4])輸出()
A、NULL
B、2
C、4
D、程序報錯
正確答案:
第14題,Python中Object={'obj_1':'1','obj_2':'2'},則Objcet.get('boj_3','3')是()
A、1
B、2
C、3
D、無輸出
正確答案:
答案來源:(www.),PyMongo中的查找方法的參數(shù)是哪種數(shù)據(jù)結構()
A、列表
B、元組
C、字典
D、集合
正確答案:
第16題,Python正則表達式模塊的findall方法提取內(nèi)容包含多個,則返回結果的列表中會包含()
A、列表
B、元組
C、字典
D、集合
正確答案:
第17題,Redis是一個開源的使用()語言編寫
A、ANSI C
B、C++
C、JAVA
D、Python
正確答案:
第18題,下面關于Charles使用說法錯誤的是()
A、在數(shù)據(jù)包非常多的情況下,使用Charles的過濾功能來對數(shù)據(jù)包進行過濾從而減少干擾。
B、通過單擊圖中方框框住的各個選項卡,可以非常直觀地觀察到請求和返回的各種信息。
C、如果瀏覽器是Chrome,在沒有安裝第三方代理插件的情況下,Chrome的HTTP流量都會經(jīng)過Charles。
D、Charles無法支持計算機上除了瀏覽器之外的其他軟件。
正確答案:
第19題,以下哪個命令是利用URL語法在命令行下工作的文件傳輸工具()
A、curl
B、tar -zxvf
C、mkdir
D、cp
正確答案:
答案來源:(www.),Python中Object=[1, 2, 3, 4, 5],則Objcet是()
A、列表
B、元組
C、字典
D、集合
正確答案:
第21題,下列關于mitmproxy的使用說法正確的是()
A、mitmproxy的端口為8080端口。
B、設置好代理以后,在手機上打開一個App或者打開一個網(wǎng)頁,可以看到mitmproxy上面有數(shù)據(jù)滾動。
C、用鼠標在終端窗口上單擊其中的任意一個請求,可以顯示這個數(shù)據(jù)包的詳情信息。
D、如果要訪問HTTPS網(wǎng)站,還需要安裝mitmproxy的證書
正確答案:,B,C,D
第22題,cookies的缺點是
A、實現(xiàn)自動登錄
B、跟蹤用戶狀態(tài)
C、http中明文傳輸
D、增加http請求的流量
正確答案:,D
第23題,以下哪些可以獨立成為Python編譯器()
A、Pycharm
B、IDLE
C、Eclipse
D、Visual Studio 2010
正確答案:,B
第24題,Python中()容器有推導式
A、列表
B、元組
C、字典
D、集合
正確答案:,C,D
答案來源:(www.),使用Selennium獲取網(wǎng)頁中元素的方法有
A、find_element_by_name
B、find_element_by_id
C、find_elements_by_name
D、find_elements_by_id
正確答案:,B,C,D
第26題,Python中一個函數(shù)沒有返回值則可以寫()
A、沒有return
B、return
C、return None
D、return NULL
正確答案:,B,C
第27題,Python中一個函數(shù)可以有()個return語句
A、0
B、1
C、多個
D、2
正確答案:,B,C,D
第28題,以下哪些方法屬于Python寫CSV文件的方法()
A、writeheaders
B、writeheader
C、writerrows
D、writerow
正確答案:,C,D
第29題,Python中通過Key來從字典object中讀取對應的Value的方法有()
A、object[key]
B、object.get(key)
C、object.pop(key)
D、object.pop()
正確答案:,B
答案來源:(www.),BS4可以用來從()中提取數(shù)據(jù)
A、HTML
B、XML
C、數(shù)據(jù)庫
D、JSON
正確答案:,B
第31題,scrapy與selenium結合可以實現(xiàn)直接處理需要異步加載的頁面
T、對
F、錯
更多答案下載:(www.)
第32題,使用UI Automatorr讓屏幕向右滾動的操作是得到相應控件后使用命令scroll.horiz.forward()
T、對
F、錯
正確答案:F
第33題,Python可以將列表或字典轉換成Json字符串
T、對
F、錯
更多答案下載:(www.)
第34題,Python中列表生成以后還可以往里面繼續(xù)添加數(shù)據(jù),也可以從里面刪除數(shù)據(jù);
T、對
F、錯
更多答案下載:(www.)
第35題,cookies在http請求中是明文傳輸?shù)摹?br/>T、對
F、錯
更多答案下載:(www.)
第36題,Python中條件語句在使用or連接的多個表達式中,只要有一個表達式為真,那么后面的表達式就不會執(zhí)行。
T、對
F、錯
更多答案下載:(www.)
第37題,在安裝Scarpy的依賴庫時,由于Visual C++ Build Tools的安裝速度很慢,為了節(jié)省時間,可以和安裝Twisted同時進行
T、對
F、錯
正確答案:F
第38題,HTTP狀態(tài)碼503表示服務器內(nèi)部故障。
T、對
F、錯
正確答案:
第39題,在有spiders何setting.py這兩項的情況下,可以寫出爬蟲并且保存數(shù)據(jù),items.py和pipelines.py文件是原作者的失誤而導致的冗余文件。
T、對
F、錯
正確答案:
第40題,在Windows中下若要運行Redis可以運行redis-server /usr/local/etc/redis.conf
T、對
F、錯
正確答案:F
第41題,Scrapyd可以同時管理多個Scrapy工程里面的多個爬蟲的多個版本
T、對
F、錯
更多答案下載:(www.)
第42題,安裝mitmdump之前,運行sudo apt-get install python3-dev python3-pip libffi-dev libssl-dev是為了安裝必要的運行環(huán)境。
T、對
F、錯
正確答案:
第43題,PyMongoDB中排序方法sort第二個參數(shù)1表示降序
T、對
F、錯
正確答案:F
第44題,charles配置中,安裝完成證書以后,在設置中打開"關于本機",找到最下面的"證書信任設置",并在里面啟動對Charles證書的完全信任。
T、對
F、錯
更多答案下載:(www.)
第45題,為了保證數(shù)據(jù)插入效率,在內(nèi)存允許的情況下,應該一次性把數(shù)據(jù)讀入內(nèi)存,盡量減少對MongoDB的讀取操作。
T、對
F、錯
正確答案:
第46題,Redis的列表是一個單向隊列
T、對
F、錯
正確答案:
第47題,數(shù)據(jù)抓包就是中間人爬蟲的一個簡單應用。所以使用Charles也是一種中間人攻擊
T、對
F、錯
更多答案下載:(www.)
第48題,如果把網(wǎng)絡上發(fā)送與接收的數(shù)據(jù)包理解為快遞包裹,那么在快遞運輸?shù)倪^程中取出查看更改里面的內(nèi)容,就是類似抓包的過程
T、對
F、錯
正確答案:F
第49題,MongoDB 是一個基于分布式文件存儲的數(shù)據(jù)庫,,速度遠快過Redis
A、對
B、錯
正確答案:
答案來源:(www.),對Charles設置代理時,Ip可以設置為127.0.0.1,端口為8888.
T、對
F、錯
正確答案:

