更新時間:2018年12月12日16時24分 來源:傳智播客 瀏覽次數(shù):
大數(shù)據(jù)培訓出來好找工作嗎?大數(shù)據(jù)相對于其他行業(yè)來說,大數(shù)據(jù)技術(shù)起點高,發(fā)展前景好。所謂起點高,就是對學習大數(shù)據(jù)技術(shù)人有著一定的要求,但是一旦學好了前景無限。
傳智播客的大數(shù)據(jù)基本上是理論加實戰(zhàn)為主,可以讓學員在豐富理論的同時,實操項目。在這里我們先看看傳智播客的大數(shù)據(jù)培訓大綱
大數(shù)據(jù)就業(yè)班課程大綱 | |||
所處階段 | 主講內(nèi)容 | 技術(shù)要點 | 學習目標 |
第二階段: JavaWeb核心 |
前端 | HTML、CSS、JavaSript、BootStrap | 核心能力培養(yǎng): 運用常用的網(wǎng)頁開發(fā)技術(shù)設(shè)計網(wǎng)頁; 掌握WEB系統(tǒng)交互原理; 掌握JavaWeb開發(fā)核心技術(shù); 運用JavaWeb核心技術(shù)完成簡單功能實現(xiàn); 掌握JavaWeb高級技術(shù),創(chuàng)建更好的Web應(yīng)用程序; 具備B/S結(jié)構(gòu)軟件開發(fā)能力。 具備能力及市場價值: 能夠完成B/S結(jié)構(gòu)網(wǎng)站開發(fā),具備了真實環(huán)境的項目部署能力; 能夠完成中小型企業(yè)管理系統(tǒng)等傳統(tǒng)項目的開發(fā)。 市場價值: 繼續(xù)努力學習。 |
數(shù)據(jù)庫 | MySQL數(shù)據(jù)庫、MySQL單表操作、MySQL多表操作、MySQL事物、 MySQL存儲引擎、JDBC、JDBCDataSource | ||
Web核心 | Tomcat、Http協(xié)議、servlet入門、Rquest、Response、JSP、MVC、 Cookie、Session、JSP、ETL、JSTL、Filter、listener | ||
web增強 | Jquery、Ajax、ajax跨域、分頁 | ||
基礎(chǔ)增強 | 多線程入門、網(wǎng)絡(luò)編程入門、反射、動態(tài)代理、注解 | ||
第三階段: 網(wǎng)站開發(fā)三大框架 |
項目構(gòu)建及管理 | Maven項目構(gòu)建、管理、編譯、倉庫配置,SVN服務(wù)器部署、 SVN客戶端、自動化部署 | 核心能力培養(yǎng): 掌握SSM框架,使用SSH框架開發(fā)出結(jié)構(gòu)清晰、可復用性好、維護方便的Web應(yīng)用程序; 掌握如何使用Maven管理項目工程; 掌握數(shù)據(jù)庫的相關(guān)技術(shù); 掌握系統(tǒng)開發(fā)中的性能、可擴展性及維護性的提升; 通過項目實戰(zhàn)熟練掌握SSM框架的使用。 具備能力及市場價值: 能夠使用SSM框架完成傳統(tǒng)企業(yè)級項目開發(fā),熟悉多種業(yè)務(wù)流程,豐富項目開發(fā)經(jīng)驗。 市場價值: 6000-8000元。 |
數(shù)據(jù)庫操作框架 | mybatis框架原理、mybatis入門案例、mybatis開發(fā)DAO方式、 mybatis輸入輸出映射、動態(tài)sql、spring整合mybatis | ||
Spring框架 | applicationContext、xml配置文件編寫、IoC思想、DI依賴注入、 使用AspectJ切面編程、JdbcTemplate模板使用、聲明式事務(wù)管理、SSH整合 | ||
SpringMVC框架 | springmvc框架原理、springmvc入門案例、springmvc整合mybatis、 參數(shù)綁定、json數(shù)據(jù)交互、攔截器 | ||
CRM項目實戰(zhàn) | 使用springmvc+spring4+mybatis+svn來開發(fā)項目、 使用BootStrap進行布局 | ||
第四階段: 大數(shù)據(jù)娛樂頭條 |
Linux服務(wù)器 | VMware虛擬機安裝、linux常用命令、linux用戶權(quán)限與網(wǎng)絡(luò)安全 | 核心能力培養(yǎng): 掌握大數(shù)據(jù)爬蟲技術(shù)開發(fā); 掌握大數(shù)據(jù)搜索引擎技術(shù)開發(fā); 掌握大數(shù)據(jù)消息隊列使用及調(diào)優(yōu); 掌握Storm實時數(shù)據(jù)分析; 掌握分布式系統(tǒng)開發(fā); 掌握互聯(lián)網(wǎng)用戶日志分析。 具備能力及市場價值: 能夠獨立開發(fā)爬蟲系統(tǒng); 能夠獨立開發(fā)搜索系統(tǒng); 能夠完成實時數(shù)據(jù)采集、存儲、計算及商業(yè)應(yīng)用。 市場價值: 8000-10000元。 |
linux下應(yīng)用tomcat、linux下應(yīng)用MySQL、linux下應(yīng)用nginx、 nginx負載均衡配置 | |||
分布式爬蟲實戰(zhàn) | 大數(shù)據(jù)娛樂頭條-項目整體介紹 | ||
大數(shù)據(jù)娛樂頭條-爬蟲基礎(chǔ)、Http協(xié)議、HttpClient網(wǎng)絡(luò)請求、 Jsoup網(wǎng)頁解析、黑客行為之后臺登錄 | |||
大數(shù)據(jù)娛樂頭條-Java并發(fā)、多線程、阻塞隊列、 網(wǎng)易娛樂爬蟲開發(fā)實戰(zhàn) | |||
大數(shù)據(jù)娛樂頭條-Redis基礎(chǔ)、Redis集群、Redis常用API、購物車、 排行榜、Redis持久化 | |||
大數(shù)據(jù)娛樂頭條-分布式爬蟲、代理IP、爬蟲攻防技術(shù)、分布式爬蟲開發(fā)實戰(zhàn) | |||
分布式搜索 | 大數(shù)據(jù)娛樂頭條-lucene基礎(chǔ)、搜索系統(tǒng)原理、Lucene創(chuàng)建索引、 Lucene查詢索引、Lucene分頁、Lucene高亮 | ||
大數(shù)據(jù)娛樂頭條-solr基礎(chǔ)、solr在Linux部署、solr管理界面、 solr創(chuàng)建索引、solr查詢索引、solr高亮、solrj客戶端管理 | |||
大數(shù)據(jù)娛樂頭條-SSM搜索服務(wù)、搜索引擎界面、搜索分頁、搜索高亮、 搜索熱詞聯(lián)想 | |||
大數(shù)據(jù)娛樂頭條-zookeeper集群、zookeeper原理、dubbox、 搜索服務(wù)開發(fā) | |||
大數(shù)據(jù)娛樂頭條-Kafka基礎(chǔ)、Kafka集群、生產(chǎn)分發(fā)策略、消息不丟失、 存儲機制、消費者負責均衡、Kafka配置文件詳解 | |||
大數(shù)據(jù)娛樂頭條-爬蟲集成Kafka、爬蟲創(chuàng)建索引、 FreeMarker熱門搜索結(jié)果靜態(tài)化 | |||
大數(shù)據(jù)娛樂頭條-綜合部署、nginx負載均衡、solrcloud集群、 solrcloud原理分析 | |||
搜索性能優(yōu)化 | 大數(shù)據(jù)娛樂頭條-nginx+lua基礎(chǔ)、點擊流日志收集系統(tǒng)部署 | ||
大數(shù)據(jù)娛樂頭條-Storm基礎(chǔ)、Storm架構(gòu)、Storm編程模型、 Storm實時看板、Storm消息不丟失 | |||
大數(shù)據(jù)娛樂頭條-Storm熱詞統(tǒng)計,提供實時熱詞靜態(tài)化 | |||
大數(shù)據(jù)娛樂頭條-Storm爬蟲日志監(jiān)控項目實戰(zhàn) | |||
大數(shù)據(jù)娛樂頭條-Storm日志分析項目實戰(zhàn) | |||
JVM與數(shù)據(jù)庫優(yōu)化 | JVM虛擬機基礎(chǔ)與性能調(diào)優(yōu) | ||
數(shù)據(jù)庫分析與優(yōu)化 | |||
第五階段: 大數(shù)據(jù)Hadoop實戰(zhàn) |
大數(shù)據(jù)環(huán)境準備 | linux基礎(chǔ)、linux的shell編程、大數(shù)據(jù)環(huán)境準備、zookeeper、網(wǎng)絡(luò)編程概述 | 核心能力培養(yǎng): 掌握離線數(shù)據(jù)收集、數(shù)據(jù)存儲、數(shù)據(jù)計算、任務(wù)調(diào)度、數(shù)據(jù)導入導出、數(shù)據(jù)報表開發(fā)技術(shù); 掌握用戶日志分析系統(tǒng)(業(yè)務(wù)分析、編碼實現(xiàn)、調(diào)度配置、數(shù)據(jù)導出、數(shù)據(jù)可視化); 掌握數(shù)據(jù)倉庫管理、元數(shù)據(jù)管理、數(shù)據(jù)稽查等常見處理技術(shù)掌握Hadoop高可用配置及管理。 具備能力及市場價值: 能夠勝任離線相關(guān)工作,包括ETL工程師、任務(wù)調(diào)度工程師、Hive工程師、數(shù)據(jù)倉庫工程師等。 市場價值: 12000-14000元。 |
Hadoop集群部署 | Hadoop的發(fā)展簡史、Hadoop的版本介紹、 三個公司對Hadoop版本的支持了解、 Hadoop1.x版本與2.x版本的架構(gòu)比較、 Apache版本Hadoop三種環(huán)境構(gòu)建、 CDH版本的Hadoop重新編譯 | ||
HDFS&MapReduce | HDFS的來源、HDFS設(shè)計目標、Hadoop的架構(gòu)圖、文件副本機制、 block塊存儲、HDFS的元數(shù)據(jù)信息、FSimage以及edits、 ScondaryNN的作用、HDFS的文件寫入過程、HDFS的文件讀取過程、 HDFS的API操作、HadoopMapReduce設(shè)計構(gòu)思、 MapReduce框架結(jié)構(gòu)、MapReduce編程規(guī)范及示例編寫、 MapReduce程序運行模式 | ||
MapReduce優(yōu)化 | MapReduce的分區(qū)、ReduceTask的數(shù)量設(shè)置、 MapReduce排序以及序列化、MapReduce計數(shù)器、MapReducecombiner、MapReduce上網(wǎng)流量統(tǒng)計、 MapTask運行機制詳解、Map任務(wù)的并行度、ReduceTask工作機制、reduceTask的并行度、MapReduceshuffle過程、shuffle階段數(shù)據(jù)的壓縮機制 | ||
自定義及資源調(diào)度 | MapReduce實現(xiàn)join、社交粉絲數(shù)據(jù)分析、mapreduce案例:倒排索引建立、 自定義inputFormat合并小文件、自定義outputFormat、 自定義GroupingComparator求取topN、mapreduce參數(shù)優(yōu)化、 Yarn資源調(diào)度 | ||
Hive數(shù)據(jù)倉庫 | 數(shù)據(jù)倉庫特征、數(shù)據(jù)倉庫架構(gòu)、Hive的概念、Hive架構(gòu)、Hive部署及使用、 HiveDDL、HiveDML、Hive命令行、Hive參數(shù)配置、Hive內(nèi)置函數(shù)、 HiveUDF開發(fā)、Hive的數(shù)據(jù)壓縮、Hive的文件格式、Hive調(diào)優(yōu)、 Hive語句綜合練習 | ||
網(wǎng)站流量日志分析 | 網(wǎng)站流量日志采集、數(shù)據(jù)分析系統(tǒng)介紹、系統(tǒng)開發(fā)架構(gòu)、Flume實現(xiàn)數(shù)據(jù)采集、 數(shù)據(jù)預處理、數(shù)據(jù)倉庫設(shè)計、ETL、統(tǒng)計分析、Sqoop結(jié)果導出、 工作流調(diào)度azkaban、數(shù)據(jù)可視化 | ||
Impala&Hue | impala的介紹、impala安裝準備、制作本地yum源、impala的安裝、 impala基本使用、impala的java開發(fā)、Hue的介紹、Hue的安裝、 hue與HDFS集成、hue與yarn集成、配置hue與hive集成、 配置hue與impala的集成、配置hue與mysql的集成 | ||
大數(shù)據(jù)新技術(shù) | Oozie介紹、Oozie架構(gòu)、Oozie的執(zhí)行流程、Oozie組件、Oozie的安裝、 hue整合Oozie、hadoopHA、hadoopFederation、CDH整體架構(gòu)、 CDH環(huán)境安裝、Kylin、kettle、kudu | ||
第六階段: 大數(shù)據(jù)Spark實戰(zhàn) |
Scala語言基礎(chǔ) | Scala基礎(chǔ)語法、Scala高級特性、Scala的Akka編程實戰(zhàn) | 核心能力培養(yǎng): 掌握Spark基礎(chǔ)、SparkRDD、SparkSQL、SparkStreaming開發(fā)技術(shù); 掌握互聯(lián)網(wǎng)電商用戶畫像建模、開發(fā)、可視化(業(yè)務(wù)知識、技術(shù)開發(fā)、架構(gòu)); 掌握數(shù)據(jù)數(shù)據(jù)存儲及存儲(Hbase+Phoenix)。 具備能力及市場價值: 能夠勝任Spark相關(guān)工作,包括ETL工程師、Spark工程師、Hbase工程師、用戶畫像系統(tǒng)工程師、大數(shù)據(jù)反欺詐工程師。 目前企業(yè)急缺Spark相關(guān)人才。 市場價值: 15000+元。 |
Spark基礎(chǔ) | Spark概述、Spark集群安裝部署、Spark運行架構(gòu)、Spark編程模型 | ||
SparkRDD | RDD概述、RDD特征、RDD算子操作、RDD依賴、RDD緩存、 Spark任務(wù)調(diào)度、checkpoint、RDD編程實戰(zhàn) | ||
SparkSQL | SparkSQL概述、DataFrame、DataFrame常用操作、DataSet介紹、 SparkSQL整合JDBC、SparkonYarn | ||
SparkStreaming | 概述、與Storm的對比、SparkStreaming原理、DStream操作實戰(zhàn)、 開窗函數(shù)、整合Flume、整合Kafka | ||
項目實戰(zhàn)階段 | 互聯(lián)網(wǎng)電商用戶畫像建模、開發(fā)、數(shù)據(jù)導入、 數(shù)據(jù)存儲(Hbase+Phoenix)、可視化 | ||
項目實戰(zhàn)階段 | 大數(shù)據(jù)反欺詐系統(tǒng)、航空領(lǐng)域反爬蟲項目實戰(zhàn)、系統(tǒng)架構(gòu)、防爬規(guī)則、 Nginx+lua+kafak整合、高頻IP檢測、SparkStreaming規(guī)則引擎開發(fā)、 數(shù)據(jù)可視化 | ||
新技術(shù) | flink的簡介、最值函數(shù)aggregate和minBy、maxBy、 去重distict和關(guān)聯(lián)join函數(shù)、union合并和rebalance負載均衡、 3種分區(qū)方式(hash、range、sort)、source數(shù)據(jù)源、flink的sink操作、 本地執(zhí)行和集群執(zhí)行、廣播變量的操作、分布式緩存的使用、 無重疊數(shù)據(jù)處理、 窗口劃分、windowTime、同步hbase、flink的source源、 基于mysql的sink操作、flink的容錯、flink對接kafka數(shù)據(jù)、案例實戰(zhàn) | ||
第七階段: 大數(shù)據(jù)機器學習實戰(zhàn) |
機器學習概念入門 | 1.基本概念:屬性、屬性的度量、屬性類型、數(shù)據(jù)集類型、數(shù)據(jù)集的特性、訓練集、測試集、特征值、監(jiān)督學習、非監(jiān)督學習、半監(jiān)督學習等概念 2.數(shù)據(jù)的預處理:聚集、抽樣、維度規(guī)約、特征子集選擇、特征創(chuàng)建、離散化和二元化、變量變換 3.模型的評估:模型的過分擬合(過擬合),欠擬合,評估分類器的性能(交叉驗證和自助法),模型評估方法、損失函數(shù)和風險函數(shù)、參數(shù)優(yōu)化等,模型復雜度(奧卡姆剃刀)4.機器學習處理的一般流程分析 |
核心能力培養(yǎng): 掌握機器學習算法理論基礎(chǔ); 熟悉Python語言基礎(chǔ)及數(shù)據(jù)科學庫; 熟悉機器學習應(yīng)用場景; 掌握Spark機器學習框架、能使用scikit-learn機器學習庫結(jié)合Python完成全棧機器學習建模; 熟悉深度基本概念、流程、常見算法、能夠使用算法解決簡單的業(yè)務(wù)問題(圖像識別等); 掌握用戶標簽預測全流程; 掌握互聯(lián)網(wǎng)行業(yè)推薦業(yè)務(wù)開發(fā); 掌握點擊率預估使用場景及項目全流程開發(fā)。 具備能力及市場價值: 能夠勝任機器學習、數(shù)據(jù)挖掘等相關(guān)工作,包括推薦算法工程師、數(shù)據(jù)挖掘工程師、機器學習工程師,填補人工智能領(lǐng)域人才急劇增長缺口。 市場價值: 18000-30000元。 |
機器學習數(shù)學基礎(chǔ) | 初等數(shù)學基礎(chǔ)、函數(shù)求導以及鏈式求導法則、方向?qū)?shù)、梯度、泰勒級數(shù)、 拉格朗日乘子法、線性代數(shù)與矩陣、特征值與特征向量、概率分析、 極大似然估計、梯度下降法代碼實踐、牛頓法代碼實戰(zhàn)、 矩陣分解實戰(zhàn)(SVD,PCA,QR) | ||
機器學習語言基礎(chǔ)之Python語言 | 基礎(chǔ)數(shù)據(jù)類型、list/tuple/dict/set、列表推導式、生成器推導式、 lambda函數(shù)、控制語句、文件讀寫、異常處理分析、面向?qū)ο缶幊獭?GUI編程、Python基礎(chǔ)項目實踐 | ||
Python數(shù)據(jù)分析庫實戰(zhàn) | Numpy矩陣運算庫基礎(chǔ)及實戰(zhàn)、Scipy數(shù)值運算庫基礎(chǔ)及實戰(zhàn)、 Matplotlib繪圖庫基礎(chǔ)及實戰(zhàn)、Seaborn繪圖庫基礎(chǔ)及實戰(zhàn)、 Pandas數(shù)據(jù)分析庫基礎(chǔ)及實戰(zhàn) | ||
Spark機器學習庫實戰(zhàn) | SparkML和SparkMLLIB區(qū)別、Spark機器學習基礎(chǔ)、Pipeline管道、 特征抽取(TF-IDF、Word2Vec、CountVectorizer)、特征轉(zhuǎn)換(Tokenizer、 PCA、N-gram、DCT、one-hot、MinMaxScaler、Normalizer、SqlTransformer、VectorAssembler)、特征選擇(VectorSlicer、RFormula、 ChiSqSelector) | ||
機器學習算法之用戶標簽預測項目實戰(zhàn) | 用戶畫像標簽預測實戰(zhàn)、KNN、KMeans、決策樹算法模型(ID3、C4.5、 Cart樹)、集成學習算法(Bagging、隨機森林、Adaboost算法、GBDT算法、 XGBOOST算法、LightGBM算法模型)、人才流失模型項目實戰(zhàn) | ||
機器學習算法之推薦系統(tǒng)實戰(zhàn) | 基于記憶的CF實戰(zhàn)(Surprise庫實戰(zhàn))、基于模型的CF實戰(zhàn)(SparkALS實戰(zhàn))、 基于Native-Bayes分類算法實戰(zhàn)、基于內(nèi)容推薦(jieba分詞、提取詞向量、 文本分類、特征聚類)、關(guān)聯(lián)挖掘算法實戰(zhàn)(基于Spark的FP-Growth算法實戰(zhàn))、推薦項目實戰(zhàn) | ||
機器學習算法之CTR點擊率預估實戰(zhàn) | 特征工程實戰(zhàn)、CTR點擊率預估應(yīng)用場景分析、 邏輯斯特回歸算法理論基礎(chǔ)推導及項目實戰(zhàn)、推薦系統(tǒng)指標分析、 推薦系統(tǒng)架構(gòu)分析、基于Wideanddeep模型理論及實戰(zhàn)(學會讀學術(shù)Paper) | ||
機器學習算法之深度學習基礎(chǔ)及圖片分類實戰(zhàn) | 神經(jīng)網(wǎng)絡(luò)和深度學習基礎(chǔ)、MP神經(jīng)元模型、感知機模型、BPNN模型實戰(zhàn)、 CNN模型實戰(zhàn)圖像識別、Tensorflow基礎(chǔ)、電影評論文本分析、 RNN文本情感分析實戰(zhàn) | ||
機器學習面試必備 | 機器學習算法串講、機器學習面試題目詳解,剖析結(jié)合人工智能實際場景、 機器學習或人工智能類崗位核心技能需求、所需知識和技能、主流機器學習工具和框架的使用方法、開放式問題和系統(tǒng)設(shè)計問題, 融匯貫通整個課程知識點、大數(shù)據(jù)和機器學習部分項目銜接 |