Python文檔作為學(xué)習(xí)Python的“必備寶典”之一,我們可以通過多種渠道來找到,例如: 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-06-06 |傳智教育 |Python文檔
Python中定義變量的方式非常簡單,只需要指定數(shù)據(jù)和變量名即可。變量的定義格式如下: 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-05-22 |傳智教育 |什么是變量,變量的定義和命名
當(dāng)我們編寫Python代碼時(shí),我們得到的是一個(gè)包含Python代碼的以.py為擴(kuò)展名的文本文件。要運(yùn)行代碼,就需要Python解釋器去執(zhí)行.py文件。Python解釋器,又稱Python虛擬機(jī),它有多種不同的實(shí)現(xiàn),下面列舉常見的幾種Python解釋器。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-05-18 |傳智教育 |Python常見解釋器
Python程序的運(yùn)行方式有兩種:交互式和文件式。交互式是指Python解釋器逐行接收Python代碼并即時(shí)響應(yīng);文件式也稱批量式,是指先將Python代碼保存在文件中,再啟動Python解釋器批量解釋代碼。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-05-17 |傳智教育 |Python程序的運(yùn)行方式,交互式和文件式
在這我們將關(guān)系模型簡單理解為 Table 和 SQL 語句,那么問題變?yōu)槿绾卧?KV 結(jié)構(gòu)上保存 Table 以及如何在 KV 結(jié)構(gòu)上運(yùn)行 SQL 語句。 假設(shè)我們有這樣一個(gè)表的定義: 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-05-17 |傳智教育 |模型映射,KV映射
窄依賴:Spark可以對窄依賴進(jìn)行優(yōu)化:合并操作,形成pipeline(管道),同一個(gè)管道中的各個(gè)操作可以由同一個(gè)線程執(zhí)行完,且如果有一個(gè)分區(qū)數(shù)據(jù)丟失,只需要從父RDD的對應(yīng)個(gè)分區(qū)重新計(jì)算即可,不需要重新計(jì)算整個(gè)任務(wù),提高容錯(cuò)。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-05-12 |傳智教育 |Spark依賴關(guān)系,什么是寬依賴,什么是窄依賴
通用網(wǎng)絡(luò)爬蟲(General Purpose Web Crawler)又稱全網(wǎng)爬蟲(Scalable Web Crawler),是指訪問全互聯(lián)網(wǎng)資源的網(wǎng)絡(luò)爬蟲。通用網(wǎng)絡(luò)爬蟲是“互聯(lián)網(wǎng)時(shí)代”早期出現(xiàn)的傳統(tǒng)網(wǎng)絡(luò)爬蟲,它是搜索引擎(如百度、谷歌、雅虎等)抓取系統(tǒng)的重要組成部分... 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-05-11 |傳智教育 |通用網(wǎng)絡(luò)爬蟲和聚焦網(wǎng)絡(luò)爬蟲的區(qū)別
表層網(wǎng)頁是指傳統(tǒng)搜索引擎可以索引的頁面,主要是以超鏈接可以到達(dá)的靜態(tài)網(wǎng)頁構(gòu)成的網(wǎng)頁。深層網(wǎng)頁是指大部分內(nèi)容無法通過... 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-05-11 |傳智教育 |表層網(wǎng)頁和深層網(wǎng)頁的定義和區(qū)別
北京校區(qū)