大數(shù)據(jù)培訓(xùn)出來好找工作嗎？

更新時間:2018年12月12日16時24分來源:傳智播客瀏覽次數(shù):

大數(shù)據(jù)培訓(xùn)出來好找工作嗎？大數(shù)據(jù)相對于其他行業(yè)來說，大數(shù)據(jù)技術(shù)起點(diǎn)高，發(fā)展前景好。所謂起點(diǎn)高，就是對學(xué)習(xí)大數(shù)據(jù)技術(shù)人有著一定的要求，但是一旦學(xué)好了前景無限。

大數(shù)據(jù)培訓(xùn)

傳智播客的大數(shù)據(jù)基本上是理論加實(shí)戰(zhàn)為主，可以讓學(xué)員在豐富理論的同時，實(shí)操項(xiàng)目。在這里我們先看看傳智播客的大數(shù)據(jù)培訓(xùn)大綱

大數(shù)據(jù)就業(yè)班課程大綱
所處階段	主講內(nèi)容	技術(shù)要點(diǎn)	學(xué)習(xí)目標(biāo)
第二階段： JavaWeb核心	前端	HTML、CSS、JavaSript、BootStrap	核心能力培養(yǎng)：運(yùn)用常用的網(wǎng)頁開發(fā)技術(shù)設(shè)計(jì)網(wǎng)頁；掌握WEB系統(tǒng)交互原理；掌握J(rèn)avaWeb開發(fā)核心技術(shù)；運(yùn)用JavaWeb核心技術(shù)完成簡單功能實(shí)現(xiàn)；掌握J(rèn)avaWeb高級技術(shù)，創(chuàng)建更好的Web應(yīng)用程序；具備B/S結(jié)構(gòu)軟件開發(fā)能力。具備能力及市場價值：能夠完成B/S結(jié)構(gòu)網(wǎng)站開發(fā)，具備了真實(shí)環(huán)境的項(xiàng)目部署能力；能夠完成中小型企業(yè)管理系統(tǒng)等傳統(tǒng)項(xiàng)目的開發(fā)。市場價值：繼續(xù)努力學(xué)習(xí)。
	數(shù)據(jù)庫	MySQL數(shù)據(jù)庫、MySQL單表操作、MySQL多表操作、MySQL事物、 MySQL存儲引擎、JDBC、JDBCDataSource
	Web核心	Tomcat、Http協(xié)議、servlet入門、Rquest、Response、JSP、MVC、 Cookie、Session、JSP、ETL、JSTL、Filter、listener
	web增強(qiáng)	Jquery、Ajax、ajax跨域、分頁
	基礎(chǔ)增強(qiáng)	多線程入門、網(wǎng)絡(luò)編程入門、反射、動態(tài)代理、注解
第三階段：網(wǎng)站開發(fā)三大框架	項(xiàng)目構(gòu)建及管理	Maven項(xiàng)目構(gòu)建、管理、編譯、倉庫配置，SVN服務(wù)器部署、 SVN客戶端、自動化部署	核心能力培養(yǎng)：掌握SSM框架，使用SSH框架開發(fā)出結(jié)構(gòu)清晰、可復(fù)用性好、維護(hù)方便的Web應(yīng)用程序；掌握如何使用Maven管理項(xiàng)目工程；掌握數(shù)據(jù)庫的相關(guān)技術(shù)；掌握系統(tǒng)開發(fā)中的性能、可擴(kuò)展性及維護(hù)性的提升；通過項(xiàng)目實(shí)戰(zhàn)熟練掌握SSM框架的使用。具備能力及市場價值：能夠使用SSM框架完成傳統(tǒng)企業(yè)級項(xiàng)目開發(fā)，熟悉多種業(yè)務(wù)流程，豐富項(xiàng)目開發(fā)經(jīng)驗(yàn)。市場價值： 6000-8000元。
	數(shù)據(jù)庫操作框架	mybatis框架原理、mybatis入門案例、mybatis開發(fā)DAO方式、 mybatis輸入輸出映射、動態(tài)sql、spring整合mybatis
	Spring框架	applicationContext、xml配置文件編寫、IoC思想、DI依賴注入、使用AspectJ切面編程、JdbcTemplate模板使用、聲明式事務(wù)管理、SSH整合
	SpringMVC框架	springmvc框架原理、springmvc入門案例、springmvc整合mybatis、參數(shù)綁定、json數(shù)據(jù)交互、攔截器
	CRM項(xiàng)目實(shí)戰(zhàn)	使用springmvc+spring4+mybatis+svn來開發(fā)項(xiàng)目、使用BootStrap進(jìn)行布局
第四階段：大數(shù)據(jù)娛樂頭條	Linux服務(wù)器	VMware虛擬機(jī)安裝、linux常用命令、linux用戶權(quán)限與網(wǎng)絡(luò)安全	核心能力培養(yǎng)：掌握大數(shù)據(jù)爬蟲技術(shù)開發(fā)；掌握大數(shù)據(jù)搜索引擎技術(shù)開發(fā)；掌握大數(shù)據(jù)消息隊(duì)列使用及調(diào)優(yōu)；掌握Storm實(shí)時數(shù)據(jù)分析；掌握分布式系統(tǒng)開發(fā)；掌握互聯(lián)網(wǎng)用戶日志分析。具備能力及市場價值：能夠獨(dú)立開發(fā)爬蟲系統(tǒng)；能夠獨(dú)立開發(fā)搜索系統(tǒng)；能夠完成實(shí)時數(shù)據(jù)采集、存儲、計(jì)算及商業(yè)應(yīng)用。市場價值： 8000-10000元。
	Linux服務(wù)器	linux下應(yīng)用tomcat、linux下應(yīng)用MySQL、linux下應(yīng)用nginx、 nginx負(fù)載均衡配置
	分布式爬蟲實(shí)戰(zhàn)	大數(shù)據(jù)娛樂頭條-項(xiàng)目整體介紹
		大數(shù)據(jù)娛樂頭條-爬蟲基礎(chǔ)、Http協(xié)議、HttpClient網(wǎng)絡(luò)請求、 Jsoup網(wǎng)頁解析、黑客行為之后臺登錄
		大數(shù)據(jù)娛樂頭條-Java并發(fā)、多線程、阻塞隊(duì)列、網(wǎng)易娛樂爬蟲開發(fā)實(shí)戰(zhàn)
		大數(shù)據(jù)娛樂頭條-Redis基礎(chǔ)、Redis集群、Redis常用API、購物車、排行榜、Redis持久化
		大數(shù)據(jù)娛樂頭條-分布式爬蟲、代理IP、爬蟲攻防技術(shù)、分布式爬蟲開發(fā)實(shí)戰(zhàn)
	分布式搜索	大數(shù)據(jù)娛樂頭條-lucene基礎(chǔ)、搜索系統(tǒng)原理、Lucene創(chuàng)建索引、 Lucene查詢索引、Lucene分頁、Lucene高亮
		大數(shù)據(jù)娛樂頭條-solr基礎(chǔ)、solr在Linux部署、solr管理界面、 solr創(chuàng)建索引、solr查詢索引、solr高亮、solrj客戶端管理
		大數(shù)據(jù)娛樂頭條-SSM搜索服務(wù)、搜索引擎界面、搜索分頁、搜索高亮、搜索熱詞聯(lián)想
		大數(shù)據(jù)娛樂頭條-zookeeper集群、zookeeper原理、dubbox、搜索服務(wù)開發(fā)
		大數(shù)據(jù)娛樂頭條-Kafka基礎(chǔ)、Kafka集群、生產(chǎn)分發(fā)策略、消息不丟失、存儲機(jī)制、消費(fèi)者負(fù)責(zé)均衡、Kafka配置文件詳解
		大數(shù)據(jù)娛樂頭條-爬蟲集成Kafka、爬蟲創(chuàng)建索引、 FreeMarker熱門搜索結(jié)果靜態(tài)化
		大數(shù)據(jù)娛樂頭條-綜合部署、nginx負(fù)載均衡、solrcloud集群、 solrcloud原理分析
	搜索性能優(yōu)化	大數(shù)據(jù)娛樂頭條-nginx+lua基礎(chǔ)、點(diǎn)擊流日志收集系統(tǒng)部署
		大數(shù)據(jù)娛樂頭條-Storm基礎(chǔ)、Storm架構(gòu)、Storm編程模型、 Storm實(shí)時看板、Storm消息不丟失
		大數(shù)據(jù)娛樂頭條-Storm熱詞統(tǒng)計(jì)，提供實(shí)時熱詞靜態(tài)化
		大數(shù)據(jù)娛樂頭條-Storm爬蟲日志監(jiān)控項(xiàng)目實(shí)戰(zhàn)
		大數(shù)據(jù)娛樂頭條-Storm日志分析項(xiàng)目實(shí)戰(zhàn)
	JVM與數(shù)據(jù)庫優(yōu)化	JVM虛擬機(jī)基礎(chǔ)與性能調(diào)優(yōu)
	JVM與數(shù)據(jù)庫優(yōu)化	數(shù)據(jù)庫分析與優(yōu)化
第五階段：大數(shù)據(jù)Hadoop實(shí)戰(zhàn)	大數(shù)據(jù)環(huán)境準(zhǔn)備	linux基礎(chǔ)、linux的shell編程、大數(shù)據(jù)環(huán)境準(zhǔn)備、zookeeper、網(wǎng)絡(luò)編程概述	核心能力培養(yǎng)：掌握離線數(shù)據(jù)收集、數(shù)據(jù)存儲、數(shù)據(jù)計(jì)算、任務(wù)調(diào)度、數(shù)據(jù)導(dǎo)入導(dǎo)出、數(shù)據(jù)報(bào)表開發(fā)技術(shù)；掌握用戶日志分析系統(tǒng)（業(yè)務(wù)分析、編碼實(shí)現(xiàn)、調(diào)度配置、數(shù)據(jù)導(dǎo)出、數(shù)據(jù)可視化）；掌握數(shù)據(jù)倉庫管理、元數(shù)據(jù)管理、數(shù)據(jù)稽查等常見處理技術(shù)掌握Hadoop高可用配置及管理。具備能力及市場價值：能夠勝任離線相關(guān)工作，包括ETL工程師、任務(wù)調(diào)度工程師、Hive工程師、數(shù)據(jù)倉庫工程師等。市場價值： 12000-14000元。
	Hadoop集群部署	Hadoop的發(fā)展簡史、Hadoop的版本介紹、三個公司對Hadoop版本的支持了解、 Hadoop1.x版本與2.x版本的架構(gòu)比較、 Apache版本Hadoop三種環(huán)境構(gòu)建、 CDH版本的Hadoop重新編譯
	HDFS&MapReduce	HDFS的來源、HDFS設(shè)計(jì)目標(biāo)、Hadoop的架構(gòu)圖、文件副本機(jī)制、 block塊存儲、HDFS的元數(shù)據(jù)信息、FSimage以及edits、 ScondaryNN的作用、HDFS的文件寫入過程、HDFS的文件讀取過程、 HDFS的API操作、HadoopMapReduce設(shè)計(jì)構(gòu)思、 MapReduce框架結(jié)構(gòu)、MapReduce編程規(guī)范及示例編寫、 MapReduce程序運(yùn)行模式
	MapReduce優(yōu)化	MapReduce的分區(qū)、ReduceTask的數(shù)量設(shè)置、 MapReduce排序以及序列化、MapReduce計(jì)數(shù)器、MapReducecombiner、MapReduce上網(wǎng)流量統(tǒng)計(jì)、 MapTask運(yùn)行機(jī)制詳解、Map任務(wù)的并行度、ReduceTask工作機(jī)制、reduceTask的并行度、MapReduceshuffle過程、shuffle階段數(shù)據(jù)的壓縮機(jī)制
	自定義及資源調(diào)度	MapReduce實(shí)現(xiàn)join、社交粉絲數(shù)據(jù)分析、mapreduce案例:倒排索引建立、自定義inputFormat合并小文件、自定義outputFormat、自定義GroupingComparator求取topN、mapreduce參數(shù)優(yōu)化、 Yarn資源調(diào)度
	Hive數(shù)據(jù)倉庫	數(shù)據(jù)倉庫特征、數(shù)據(jù)倉庫架構(gòu)、Hive的概念、Hive架構(gòu)、Hive部署及使用、 HiveDDL、HiveDML、Hive命令行、Hive參數(shù)配置、Hive內(nèi)置函數(shù)、 HiveUDF開發(fā)、Hive的數(shù)據(jù)壓縮、Hive的文件格式、Hive調(diào)優(yōu)、 Hive語句綜合練習(xí)
	網(wǎng)站流量日志分析	網(wǎng)站流量日志采集、數(shù)據(jù)分析系統(tǒng)介紹、系統(tǒng)開發(fā)架構(gòu)、Flume實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)倉庫設(shè)計(jì)、ETL、統(tǒng)計(jì)分析、Sqoop結(jié)果導(dǎo)出、工作流調(diào)度azkaban、數(shù)據(jù)可視化
	Impala&Hue	impala的介紹、impala安裝準(zhǔn)備、制作本地yum源、impala的安裝、 impala基本使用、impala的java開發(fā)、Hue的介紹、Hue的安裝、 hue與HDFS集成、hue與yarn集成、配置hue與hive集成、配置hue與impala的集成、配置hue與mysql的集成
	大數(shù)據(jù)新技術(shù)	Oozie介紹、Oozie架構(gòu)、Oozie的執(zhí)行流程、Oozie組件、Oozie的安裝、 hue整合Oozie、hadoopHA、hadoopFederation、CDH整體架構(gòu)、 CDH環(huán)境安裝、Kylin、kettle、kudu
第六階段：大數(shù)據(jù)Spark實(shí)戰(zhàn)	Scala語言基礎(chǔ)	Scala基礎(chǔ)語法、Scala高級特性、Scala的Akka編程實(shí)戰(zhàn)	核心能力培養(yǎng)：掌握Spark基礎(chǔ)、SparkRDD、SparkSQL、SparkStreaming開發(fā)技術(shù)；掌握互聯(lián)網(wǎng)電商用戶畫像建模、開發(fā)、可視化（業(yè)務(wù)知識、技術(shù)開發(fā)、架構(gòu)）；掌握數(shù)據(jù)數(shù)據(jù)存儲及存儲（Hbase+Phoenix）。具備能力及市場價值：能夠勝任Spark相關(guān)工作，包括ETL工程師、Spark工程師、Hbase工程師、用戶畫像系統(tǒng)工程師、大數(shù)據(jù)反欺詐工程師。目前企業(yè)急缺Spark相關(guān)人才。市場價值： 15000+元。
	Spark基礎(chǔ)	Spark概述、Spark集群安裝部署、Spark運(yùn)行架構(gòu)、Spark編程模型
	SparkRDD	RDD概述、RDD特征、RDD算子操作、RDD依賴、RDD緩存、 Spark任務(wù)調(diào)度、checkpoint、RDD編程實(shí)戰(zhàn)
	SparkSQL	SparkSQL概述、DataFrame、DataFrame常用操作、DataSet介紹、 SparkSQL整合JDBC、SparkonYarn
	SparkStreaming	概述、與Storm的對比、SparkStreaming原理、DStream操作實(shí)戰(zhàn)、開窗函數(shù)、整合Flume、整合Kafka
	項(xiàng)目實(shí)戰(zhàn)階段	互聯(lián)網(wǎng)電商用戶畫像建模、開發(fā)、數(shù)據(jù)導(dǎo)入、數(shù)據(jù)存儲（Hbase+Phoenix）、可視化
	項(xiàng)目實(shí)戰(zhàn)階段	大數(shù)據(jù)反欺詐系統(tǒng)、航空領(lǐng)域反爬蟲項(xiàng)目實(shí)戰(zhàn)、系統(tǒng)架構(gòu)、防爬規(guī)則、 Nginx+lua+kafak整合、高頻IP檢測、SparkStreaming規(guī)則引擎開發(fā)、數(shù)據(jù)可視化
	新技術(shù)	flink的簡介、最值函數(shù)aggregate和minBy、maxBy、去重distict和關(guān)聯(lián)join函數(shù)、union合并和rebalance負(fù)載均衡、 3種分區(qū)方式（hash、range、sort）、source數(shù)據(jù)源、flink的sink操作、本地執(zhí)行和集群執(zhí)行、廣播變量的操作、分布式緩存的使用、無重疊數(shù)據(jù)處理、窗口劃分、windowTime、同步hbase、flink的source源、基于mysql的sink操作、flink的容錯、flink對接kafka數(shù)據(jù)、案例實(shí)戰(zhàn)
第七階段：大數(shù)據(jù)機(jī)器學(xué)習(xí)實(shí)戰(zhàn)	機(jī)器學(xué)習(xí)概念入門	1.基本概念：屬性、屬性的度量、屬性類型、數(shù)據(jù)集類型、數(shù)據(jù)集的特性、訓(xùn)練集、測試集、特征值、監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)等概念 2.數(shù)據(jù)的預(yù)處理：聚集、抽樣、維度規(guī)約、特征子集選擇、特征創(chuàng)建、離散化和二元化、變量變換 3.模型的評估：模型的過分?jǐn)M合(過擬合)，欠擬合，評估分類器的性能(交叉驗(yàn)證和自助法)，模型評估方法、損失函數(shù)和風(fēng)險(xiǎn)函數(shù)、參數(shù)優(yōu)化等，模型復(fù)雜度(奧卡姆剃刀)4.機(jī)器學(xué)習(xí)處理的一般流程分析	核心能力培養(yǎng)：掌握機(jī)器學(xué)習(xí)算法理論基礎(chǔ)；熟悉Python語言基礎(chǔ)及數(shù)據(jù)科學(xué)庫；熟悉機(jī)器學(xué)習(xí)應(yīng)用場景；掌握Spark機(jī)器學(xué)習(xí)框架、能使用scikit-learn機(jī)器學(xué)習(xí)庫結(jié)合Python完成全棧機(jī)器學(xué)習(xí)建模；熟悉深度基本概念、流程、常見算法、能夠使用算法解決簡單的業(yè)務(wù)問題（圖像識別等）；掌握用戶標(biāo)簽預(yù)測全流程；掌握互聯(lián)網(wǎng)行業(yè)推薦業(yè)務(wù)開發(fā)；掌握點(diǎn)擊率預(yù)估使用場景及項(xiàng)目全流程開發(fā)。具備能力及市場價值：能夠勝任機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等相關(guān)工作，包括推薦算法工程師、數(shù)據(jù)挖掘工程師、機(jī)器學(xué)習(xí)工程師，填補(bǔ)人工智能領(lǐng)域人才急劇增長缺口。市場價值： 18000-30000元。
	機(jī)器學(xué)習(xí)數(shù)學(xué)基礎(chǔ)	初等數(shù)學(xué)基礎(chǔ)、函數(shù)求導(dǎo)以及鏈?zhǔn)角髮?dǎo)法則、方向?qū)?shù)、梯度、泰勒級數(shù)、拉格朗日乘子法、線性代數(shù)與矩陣、特征值與特征向量、概率分析、極大似然估計(jì)、梯度下降法代碼實(shí)踐、牛頓法代碼實(shí)戰(zhàn)、矩陣分解實(shí)戰(zhàn)(SVD,PCA,QR)
	機(jī)器學(xué)習(xí)語言基礎(chǔ)之Python語言	基礎(chǔ)數(shù)據(jù)類型、list/tuple/dict/set、列表推導(dǎo)式、生成器推導(dǎo)式、 lambda函數(shù)、控制語句、文件讀寫、異常處理分析、面向?qū)ο缶幊獭?GUI編程、Python基礎(chǔ)項(xiàng)目實(shí)踐
	Python數(shù)據(jù)分析庫實(shí)戰(zhàn)	Numpy矩陣運(yùn)算庫基礎(chǔ)及實(shí)戰(zhàn)、Scipy數(shù)值運(yùn)算庫基礎(chǔ)及實(shí)戰(zhàn)、 Matplotlib繪圖庫基礎(chǔ)及實(shí)戰(zhàn)、Seaborn繪圖庫基礎(chǔ)及實(shí)戰(zhàn)、 Pandas數(shù)據(jù)分析庫基礎(chǔ)及實(shí)戰(zhàn)
	Spark機(jī)器學(xué)習(xí)庫實(shí)戰(zhàn)	SparkML和SparkMLLIB區(qū)別、Spark機(jī)器學(xué)習(xí)基礎(chǔ)、Pipeline管道、特征抽取(TF-IDF、Word2Vec、CountVectorizer）、特征轉(zhuǎn)換(Tokenizer、 PCA、N-gram、DCT、one-hot、MinMaxScaler、Normalizer、SqlTransformer、VectorAssembler)、特征選擇(VectorSlicer、RFormula、 ChiSqSelector)
	機(jī)器學(xué)習(xí)算法之用戶標(biāo)簽預(yù)測項(xiàng)目實(shí)戰(zhàn)	用戶畫像標(biāo)簽預(yù)測實(shí)戰(zhàn)、KNN、KMeans、決策樹算法模型(ID3、C4.5、 Cart樹)、集成學(xué)習(xí)算法(Bagging、隨機(jī)森林、Adaboost算法、GBDT算法、 XGBOOST算法、LightGBM算法模型)、人才流失模型項(xiàng)目實(shí)戰(zhàn)
	機(jī)器學(xué)習(xí)算法之推薦系統(tǒng)實(shí)戰(zhàn)	基于記憶的CF實(shí)戰(zhàn)(Surprise庫實(shí)戰(zhàn))、基于模型的CF實(shí)戰(zhàn)(SparkALS實(shí)戰(zhàn))、基于Native-Bayes分類算法實(shí)戰(zhàn)、基于內(nèi)容推薦(jieba分詞、提取詞向量、文本分類、特征聚類)、關(guān)聯(lián)挖掘算法實(shí)戰(zhàn)(基于Spark的FP-Growth算法實(shí)戰(zhàn))、推薦項(xiàng)目實(shí)戰(zhàn)
	機(jī)器學(xué)習(xí)算法之CTR點(diǎn)擊率預(yù)估實(shí)戰(zhàn)	特征工程實(shí)戰(zhàn)、CTR點(diǎn)擊率預(yù)估應(yīng)用場景分析、邏輯斯特回歸算法理論基礎(chǔ)推導(dǎo)及項(xiàng)目實(shí)戰(zhàn)、推薦系統(tǒng)指標(biāo)分析、推薦系統(tǒng)架構(gòu)分析、基于Wideanddeep模型理論及實(shí)戰(zhàn)(學(xué)會讀學(xué)術(shù)Paper)
	機(jī)器學(xué)習(xí)算法之深度學(xué)習(xí)基礎(chǔ)及圖片分類實(shí)戰(zhàn)	神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)基礎(chǔ)、MP神經(jīng)元模型、感知機(jī)模型、BPNN模型實(shí)戰(zhàn)、 CNN模型實(shí)戰(zhàn)圖像識別、Tensorflow基礎(chǔ)、電影評論文本分析、 RNN文本情感分析實(shí)戰(zhàn)
	機(jī)器學(xué)習(xí)面試必備	機(jī)器學(xué)習(xí)算法串講、機(jī)器學(xué)習(xí)面試題目詳解，剖析結(jié)合人工智能實(shí)際場景、機(jī)器學(xué)習(xí)或人工智能類崗位核心技能需求、所需知識和技能、主流機(jī)器學(xué)習(xí)工具和框架的使用方法、開放式問題和系統(tǒng)設(shè)計(jì)問題，融匯貫通整個課程知識點(diǎn)、大數(shù)據(jù)和機(jī)器學(xué)習(xí)部分項(xiàng)目銜接