可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請?zhí)砑観Q:3230981406 微信:aopopenfd777
21春學(xué)期(1709、1803、1809、1903、1909、2003、2009、2103)《大數(shù)據(jù)開發(fā)技術(shù)(一)》在線作業(yè)
試卷總分:100 得分:100
第1題,Map Task和Reduce Task均由()啟動。
A、Client
B、Job Tracker
C、Task
D、Task Tracker
正確答案:
第2題,MongoDB將數(shù)據(jù)存儲為一個()
A、關(guān)系
B、屬性
C、字段
D、文檔
正確答案:
第3題,MapReduce中最優(yōu)的Reduce任務(wù)個數(shù)取決于集群中可用的()的數(shù)目。
A、Split
B、Slot
C、Map
D、Shuffle
正確答案:
第4題,Hbase中()文件記錄了-ROOT-表的位置
A、Master
B、Region
C、Zookeeper
D、Chubby
正確答案:
答案來源:(www.),BigTable采用()作為底層數(shù)據(jù)存儲
A、HDFS
B、GFS
C、Hbase
D、傳統(tǒng)文件系統(tǒng)
正確答案:
第6題,Hadoop啟動所有進程的命令為()。
A、all-start.sh
B、all-start.exe
C、start-all.sh
D、start-all.exe
正確答案:
第7題,MapReduce處理關(guān)系的()運算時,Map過程需要記錄元組的信息及該元組來源。
A、投影
B、差
C、交
D、并
正確答案:
第8題,Hbase中()是最核心的模塊,負(fù)責(zé)維護分配給自己的Region,并響應(yīng)用戶的讀寫請求
A、Master
B、Slaver
C、Regio服務(wù)器n
D、客戶端
正確答案:
第9題,關(guān)于Strom中Bolt說法錯誤的是()。
A、Bolt可以執(zhí)行過濾、函數(shù)操作、Join、操作數(shù)據(jù)庫等任何操作
B、Bolt是一個被動的角色,Spout是一個主動的角色
C、Bolt不僅可以處理Tuple還可以創(chuàng)建新的Tuple
D、Bolt是Streams的狀態(tài)轉(zhuǎn)換過程的抽象含義
正確答案:
答案來源:(www.),MapReduce設(shè)計的一個理念就是(),因為移動數(shù)據(jù)需要大量的網(wǎng)絡(luò)傳輸開銷。
A、數(shù)據(jù)向計算靠攏
B、計算向數(shù)據(jù)靠攏
C、計算向網(wǎng)絡(luò)靠攏
D、計算與數(shù)據(jù)并行
正確答案:
第11題,在Storm的工作流程中,對于Supervisor說法錯誤的是()。
A、Supervisor會去Zookeeper集群上認(rèn)領(lǐng)自己的Task
B、Supervisor節(jié)點首先將提交的Topology進行分片,分成一個個Task,分配給相應(yīng)的Nimbus
C、Supervisor會將Task和相關(guān)的信息提交到Zookeeper集群上
D、Supervisor會通知自己的Worker進程進行Task的處理
正確答案:
答案來源:(www.),Google Fusion Tables是哪種可視化工具()
A、信息圖表
B、地圖工具
C、時間線工具
D、分析工具
正確答案:
第13題,批處理系統(tǒng)關(guān)注(),流處理系統(tǒng)關(guān)注()。
A、吞吐率,延時
B、延時,吞吐率
C、延時,速度
D、速度,吞吐率
正確答案:
第14題,使用Amazon云環(huán)境部署Hadoop的說法中錯誤的是()。
A、Hadoop不僅可以運行在企業(yè)內(nèi)部的集群中,也可以運行在云計算環(huán)境中
B、Hadoop自帶有一套腳本,用于在EC2上面運行Hadoop
C、在EC2上運行Hadoop尤其適用于一些工作流
D、Amazon EC2為Hadoop提供了存儲服務(wù)
正確答案:
答案來源:(www.),關(guān)于分布式并行編程,以下說法錯誤的是()。
A、"摩爾定律",CPU性能大約每隔12個月翻一番
B、"摩爾定律"逐漸失效后,人們開始借助于分布式并行編程來提高程序性能
C、分布式程序運行在大規(guī)模計算機集群上,可以并行執(zhí)行大規(guī)模數(shù)據(jù)處理任務(wù),從而獲得海量的計算能力
D、谷歌公司最先提出了分布式并行編程模型MapReduce
正確答案:
第16題,靜態(tài)數(shù)據(jù)采取()計算模式
A、批量
B、實時
C、大數(shù)據(jù)
D、動態(tài)
正確答案:
第17題,優(yōu)點是性能好(高并發(fā)),靈活性高,復(fù)雜性低,數(shù)據(jù)結(jié)構(gòu)靈活
提供嵌入式文檔功能的數(shù)據(jù)庫是()
A、列族數(shù)據(jù)庫
B、鍵值數(shù)據(jù)庫
C、圖數(shù)據(jù)庫
D、文檔數(shù)據(jù)庫
正確答案:
第18題,關(guān)于MapReduce中Shuffle過程,說法錯誤的是()。
A、Shuffle過程中為每個Map任務(wù)分配一個緩存
B、Shuffle過程中分區(qū)默認(rèn)采用哈希函數(shù)
C、Shulle過程的合并會改變最終結(jié)果
D、Shuffle過程在Reduce端首先從Map端領(lǐng)取結(jié)果,然后執(zhí)行歸并操作,最后輸送給Reduce任務(wù)進行處理。
正確答案:
第19題,Storm中如果要隨機分發(fā)Stream中的Tuple,保證每個Bolt的Task接收Tuple數(shù)量大致一致,應(yīng)該采用哪種Stream Groupings()。
A、ShuffleGrouping
B、AllGrouping
C、GlobalGrouping
D、FiedlsGrouping
正確答案:
答案來源:(www.),SQL Azure體系結(jié)構(gòu)層中哪層將用戶的請求轉(zhuǎn)化為Azure內(nèi)部的TDS格式流
A、Client Layer
B、Services Layer
C、Platform Layer
D、Infrastructure Layer
正確答案:
第21題,優(yōu)點是查找速度快,可擴展性強,容易進行分布式擴展,復(fù)雜性低的數(shù)據(jù)庫是()
A、列族數(shù)據(jù)庫
B、鍵值數(shù)據(jù)庫
C、圖數(shù)據(jù)庫
D、文檔數(shù)據(jù)庫
正確答案:
第22題,應(yīng)用于專門用于處理具有高度相互關(guān)聯(lián)關(guān)系的數(shù)據(jù),比較適合于社交網(wǎng)絡(luò)的數(shù)據(jù)庫是哪種()
A、列族數(shù)據(jù)庫
B、鍵值數(shù)據(jù)庫
C、圖數(shù)據(jù)庫
D、文檔數(shù)據(jù)庫
正確答案:
第23題,Storm中如果要保證相同字段的Tuple分配到同一個Task中,應(yīng)該采用哪種Stream Groupings()。
A、ShuffleGrouping
B、AllGrouping
C、GlobalGrouping
D、FiedlsGrouping
正確答案:
第24題,應(yīng)用于分布式數(shù)據(jù)存儲與管理
數(shù)據(jù)在地理上分布于多個數(shù)據(jù)中心的應(yīng)用程序的數(shù)據(jù)庫是哪種()
A、列族數(shù)據(jù)庫
B、鍵值數(shù)據(jù)庫
C、圖數(shù)據(jù)庫
D、文檔數(shù)據(jù)庫
正確答案:
答案來源:(www.),1秒定律體現(xiàn)了大數(shù)據(jù)的哪個特征()。
A、數(shù)據(jù)量大
B、數(shù)據(jù)產(chǎn)生速度快
C、數(shù)據(jù)存儲快
D、數(shù)據(jù)計算快
正確答案:
第26題,SQL Azure體系結(jié)構(gòu)層中哪層是存儲節(jié)點集群,相當(dāng)于普通Web系統(tǒng)的數(shù)據(jù)庫層
A、Client Layer
B、Services Layer
C、Platform Layer
D、Infrastructure Layer
正確答案:
第27題,Gephi是哪種可視化工具()
A、信息圖表
B、地圖工具
C、時間線工具
D、分析工具
正確答案:
第28題,以下亞馬遜的產(chǎn)品中哪個是分布式內(nèi)存緩存
A、ElastiCache
B、RDS
C、DynamoDB
D、Redshift
正確答案:
第29題,Hadoop中執(zhí)行MapReduce任務(wù)不含哪種方式()。
A、Mahout
B、Hadoop jar
C、Shell腳本
D、Python
正確答案:
答案來源:(www.),以下說法不正確的是()。
A、MapReduce的核心思想就是"分面治之"
B、HDFS是對GFS的開源實現(xiàn)
C、MapReduce是一種分布式計算模型
D、HDFS采用HBase作為其底層數(shù)據(jù)存儲
正確答案:
第31題,關(guān)系數(shù)據(jù)庫與NoSQL數(shù)據(jù)庫相比有哪些優(yōu)勢()
A、支持事務(wù)ACID四性
B、可以支持超大規(guī)模數(shù)據(jù)存儲
C、以完善的關(guān)系代數(shù)理論作為基礎(chǔ)
D、具有強大的橫向擴展能力
正確答案:,C
第32題,MapReduce可以解決哪些計算問題()。
A、矩陣乘法
B、關(guān)系代數(shù)運算
C、聚合運算
D、關(guān)系投影運算
正確答案:,B,C,D
第33題,關(guān)系數(shù)據(jù)庫與NoSQL數(shù)據(jù)庫相比適用于哪些領(lǐng)域()
A、電信
B、銀行
C、互聯(lián)網(wǎng)企業(yè)大數(shù)據(jù)處理
D、傳統(tǒng)企業(yè)的數(shù)據(jù)分析
正確答案:,B
第34題,HDFS的命名空間包含()
A、節(jié)點
B、目錄
C、文件
D、塊
正確答案:,C,D
第35題,MapReduce的main函數(shù)中設(shè)置輸出類型的方法有()。
A、setOutputKeyClass
B、setOutputClass
C、setOutputValueClass
D、setKeyValueClass
正確答案:,C
第36題,Hadoop在配置偽分布式時需要修改哪幾個配置文件()。
A、hbase-site.xml
B、hdfs-site.xml
C、core-site.xml
D、map-site.xml
E、mapr-site.xml
正確答案:,C
第37題,哪些屬于數(shù)據(jù)可視化的重要作用()
A、分析數(shù)據(jù)
B、采集數(shù)據(jù)
C、輔助理解數(shù)據(jù)
D、觀測跟蹤數(shù)據(jù)
正確答案:
第38題,以下哪些是數(shù)據(jù)可視化時間線工具()
A、Echarts
B、Timetoast
C、Xtimeline
D、R
正確答案:
第39題,流計算是針對流數(shù)據(jù)的實時計算,可以應(yīng)用在()場景中
A、廣告投放
B、氣候模擬預(yù)測
C、機器翻譯
D、推薦系統(tǒng)
正確答案:
第40題,傳統(tǒng)的數(shù)據(jù)處理流程的前提是()。
A、存儲的數(shù)據(jù)是舊的
B、存儲的數(shù)據(jù)是實時的
C、需要用戶主動發(fā)出查詢
D、不需要用戶主動發(fā)出查詢
正確答案:,C
第41題,Pig是Hadoop項目中一種數(shù)據(jù)倉庫工具。
T、對
F、錯
正確答案:F
第42題,阿里云RDS中一個實例可以創(chuàng)建多個數(shù)據(jù)庫,在實例內(nèi)數(shù)據(jù)庫命名唯一,所有數(shù)據(jù)庫都會共享該實例下的資源,如CPU、內(nèi)存、磁盤容量等
T、對
F、錯
更多答案下載:(www.)
第43題,HDFS中的NameNode的EditLog用于維護文件系統(tǒng)樹以及文件樹中所有的文件和文件夾的元數(shù)據(jù)
T、對
F、錯
正確答案:F
第44題,Storm框架是實時計算系統(tǒng),所以不能使用數(shù)據(jù)庫。
T、對
F、錯
正確答案:
第45題,關(guān)系數(shù)據(jù)庫的關(guān)鍵特性包括完善的事務(wù)機制和高效的查詢機制
T、對
F、錯
更多答案下載:(www.)
第46題,大數(shù)據(jù)計算處理方法主要分為兩種方法,即批處理方法和流處理方法。
T、對
F、錯
正確答案:
第47題,大數(shù)據(jù)決策逐漸成為一種新的決策方式,大數(shù)據(jù)應(yīng)用有力促進了信息技術(shù)與各行業(yè)的深度融合,大數(shù)據(jù)開發(fā)大大推動了新技術(shù)和新應(yīng)用的不斷涌現(xiàn)。
T、對
F、錯
正確答案:
第48題,Hbase中緩存刷新,每次刷寫都生成一個新的StoreFile文件,因此,每個Store包含多個StoreFile文件
T、對
F、錯
更多答案下載:(www.)
第49題,在HBase中,更新操作會用最新的當(dāng)前值去替換記錄中原來的舊值,舊值被覆蓋后就不會存在
T、對
F、錯
正確答案:F
答案來源:(www.),HDFS 在設(shè)計上采取了多種機制保證在硬件出錯的環(huán)境中實現(xiàn)數(shù)據(jù)的完整性。
T、對
F、錯
正確答案:

