用 matplotlib 繪制圖表,默認設置下,是無法在圖中正確顯示中文的。原因無非兩種,一種是字符編碼不正確,一種是字體不支持中文。前一種情況總是發生在 Python 2 用戶身上,解決方法是把字符轉成 UTF-8。而 Python 3 統一使用 Unicode,不存在這個問題。
本文主要解決的是第二種問題:字體不支持中文。
背景知識
想快速解決問題可直接跳到步驟一,有不明白的地方再來閱讀背景知識。
matplotlib 從配置文件 matplotlibrc
中讀取配置,字體相關內容也在其中。matplotlib 依次在以下四個位置尋找配置文件:
- 當前工作目錄下的
matplotlibrc
。 -
$MATPLOTLIBRC/matplotlibrc
。 - 用戶家目錄下的
matplotlibrc
。 如 Linux 一般在~/.config/matplotlib/matplotlibrc
, macOS 在~/.matplotlib/matplotlibrc
。 -
INSTALL/matplotlib/mpl-data/matplotlibrc
,其中INSTALL
指具體的安裝目錄。
詳見官方文檔。查詢當前使用的 matplotlibrc
所在目錄,可以用 get_configdir()
函數:
import matplotlib
matplotlib.get_configdir()
這里有一份配置文件示例可供下載。
閱讀配置文件可以發現,matplotlib 默認使用的 font.family
是 sans-serif
,即無襯線字體,而無襯線字體又是從這幾種字體中依次選用:
font.sans-serif : Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif
全是西文字體,沒一個支持中文的。而且 matplotlib 對字體文件的格式也很挑剔,除了 .ttf
其他一概不認。比如 macOS Sierra 中的 Lucida Grande 是 .ttc
格式,即便按照順位輪到它了,仍然會被跳過。
查詢當前的 font.family
:
matplotlib.font_manager.FontProperties().get_family()
查詢當前使用字體:
from matplotlib.font_manager import findfont, FontProperties
findfont(FontProperties(family=FontProperties().get_family()))
鋪墊結束,我們利用上面的知識解決問題。
步驟一
Python 2 用戶請先確認字符編碼為 UTF-8。Python 3 用戶直接跳過此步驟。
步驟二
尋找支持中文并且安裝為 .ttf
格式的字體。
Windows 用戶應該總能找到 SimHei.ttf
。*nix 用戶可以通過 fc-list
命令或者圖形工具在當前系統內查詢。如果不幸真沒找到符合條件的,你就得自己去下載一個或者進行格式轉換了。SimHei.ttf
應該很容易找到,然而其實是未獲授權的。文泉驛微米黑是一種自由字體,推薦使用。
.ttc
轉換為 .ttf
,網上有不少在線或線下工具,可以自行搜索。
友情提示一句,請選擇各種黑體作為圖表中的字體,宋體放在圖表中,丑死了。
步驟三
新安裝的字體 matplotlib 一時不能找到,需要更新字體列表緩存。
如果你建立了 ~/.matplotlib/
目錄的話,應該會在其中找到 fontList.py3k.cache
。在其中找到 Vera.ttf
的安裝目錄,把新安裝的字體復制到該目錄下。
刪除 fontList.py3k.cache
。matplotlib 下次啟動時會重建緩存,新字體隨之被添加。
步驟四
現在就要在程序中使用中文字體了。
首先,你得知道字體的英文名稱,比如 SimHei.ttf
就叫 SimHei,文泉驛微米黑叫 WenQuanYi Micro Hei。
然后,你有兩種方法告訴 matplotlib 使用這些字體:
- 在
matplotlibrc
中,添加像這樣的一行:
font.sans-serif : WenQuanYi Micro Hei, Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif
把中文字體作為第一順序選用的字體。
- 在程序文件開頭,指定字體:
import matplotlib
matplotlib.rcParams['font.sans-serif'] = 'WenQuanYi Micro Hei'
第2種方法很靈活,可以針對每個文件單獨設置。如果使用第1種方法,建議把 matplotlibrc
放在當前工作目錄下,不要作為全局配置。
好了,配置完成,效果如圖: