在 Python 中資料視覺化在該領域,matplotlib 一直是使用最廣泛的視覺化庫。 然而,其操作的複雜性一直困擾著使用者。 為了解決這個問題,seaborn它應運而生,並因其簡化的操作流程而受到廣泛關注。 儘管如此,seaborn它們的使用方式仍然存在一些缺陷。 經過長達 10 年的拋光,seaborn該團隊在 0該更新的第 12 版提出了一種全新的操作模式。 嘗試後,我完全被這個新模型所震撼,不想回到舊的使用方式。 在本文中,我們將介紹新版本seaborn。這一次,它是:seaborn0.13版本。
在新模式下,seaborn引入了一種稱為“物件”的工作型別介面“操作模式,通過進口seaborn.objects 模組。 在開始之前,我們需要匯入資料,這裡我用乙個咖啡銷售資料作為例子。 在開始繪製之前,我們需要做一些配置,以確保圖表中的中文不會出現亂碼。 接下來,我們可以愉快地開始畫畫了。
讓我們先來看看利潤和銷售額之間的關係。 由於這兩個變數這都是數字,我們可以使用它散布圖來代表。 在新模式中,按照視覺化圖語法的規範,我們首先使用plot() 宣告資料和對映,然後在每次呼叫 add() 方法時使用 add() 方法鏈結並新增乙個新圖形。 在 add() 方法中,第乙個引數指定了您想要的圖形型別,這裡我們使用dot() 來表示 “point”。 這樣,我們可以很容易地畫出散布圖
現在,我們希望登上頂峰散布圖新增擬合多段線。 在新模式中,每個 add() 方法呼叫等同於新增新的圖表或圖層,第乙個引數指定模式型別,後續引數用於轉換資料。 我們可以這樣使用polyfit() 來執行擬合計算。 當然,計算方法可以定製。 使用這種方法,我們可以輕鬆地將擬合折線新增到圖表中。 新模型可能看起來有點複雜,但您會發現它的魅力。
接下來,我們不只是想畫畫散布圖,也希望根據不同地區進行分類展示。 按區域分類意味著我們需要為每個區域分配不同的顏色。 在新模式下,非常簡單,只需在**中進行顏色對映即可。 除了顏色之外,還有許多其他屬性可以對映,例如我們可以根據毛利潤調整點的大小。 通過這種方式,我們可以很容易地配對:散布圖進行各種演示。 與舊模式相比,新模式的優勢明顯,大大減輕了我們的負擔。
繼續舉例說明。 我們可以使用新模型輕鬆繪製出該地區的銷售額直方圖。但是,在執行上面的**時,您可能會發現繪圖需要很長時間。 同時,繪製的圖表有點奇怪。 原因是我們沒有在 add() 方法呼叫中指定聚合方法。 因此,預設情況下,程式將每條線繪製為條形圖。 解決這個問題很簡單,只需在 add() 方法中指定即可直方圖可以聚合。 通過sosoagg() 方法的第乙個引數,我們可以指定聚合方法,這是預設的'mean',也可以傳遞給其他人聚合函式或自定義函式。 這與以下方面有關:pandasagg() 方法的原理是一樣的。
接下來,在直方圖我們希望按市場類別對顯示器進行細分。 即根據不同的市場類別進行顏色對映。 但是,當我們執行上面的**時,結果似乎有些不對勁。 為什麼小市場比大市場賣得更多? 讓我們分析一下過程以了解結果。 資料反映了 x、y 和 color 這三個字段,以便繪製它們直方圖,您需要對 x 和 color 字段進行分組,並均勻地聚合 y 列。 通過sosoagg() 方法,我們可以得到如下聚合結果。 相信經過這個解釋,你已經完全理解了新模式的機制,實在是太容易實現了! 你可以再看一些例子來加深你的印象。
當使用新模式時,我們可以向 add() 方法新增無限數量的資料處理函式seaborn還提供了一些常用的資料操作方法供我們選擇。 只需根據您的需要選擇合適的方法即可。 現在是時候充分利用這些方法了,它們真的非常方便實用。 快來試試吧,你會感受到它的魅力。 別忘了點讚、收藏、關注,這是我創作的最大動力。
在本文中,我們介紹了:seaborn庫的新操作模式 - 物件介面。通過引入物件介面seaborn大大簡化資料視覺化過程。 在新模式中,我們首先通過宣告資料和對映來構建圖形,然後通過鏈結 add() 方法逐步新增層。 每層可以指定不同的模式型別,並通過資料處理功能轉換資料。 同時,seaborn它提供了豐富的資料操作方式,可以根據需要自由選擇。 通過這種方式,我們可以輕鬆繪製顯示多條資料的各種圖表尺寸
通過對新模式的學習和實踐,我們不僅掌握了:seaborn以及對其背後的原理的深刻理解。 相較於傳統的一函式一圖表模型,新模型大大簡化了我們的使用負擔,提高了視覺化的效率和靈活性。 通過本文的介紹,希望讀者是對的seaborn對新模式有更深入的了解,能夠快速上手。