📚 pandas read_csv 出现中文乱码 😅
在使用 `pandas` 的 `read_csv` 函数读取 CSV 文件时,如果遇到中文乱码问题,别慌!这通常是编码格式不匹配导致的。大多数情况下,文件可能是以 UTF-8 或 GBK 编码保存的,而 Python 默认可能没有正确识别编码类型。以下是解决办法:
首先,检查你的 CSV 文件实际使用的编码方式。可以尝试用 `open()` 函数手动加载文件并指定编码格式,例如:
```python
with open('file.csv', 'r', encoding='gbk') as f:
print(f.read())
```
如果能正常显示中文,那就说明是编码问题。接下来,在 `read_csv` 中添加 `encoding` 参数,明确指定编码类型即可:
```python
import pandas as pd
df = pd.read_csv('file.csv', encoding='gbk')
print(df)
```
此外,如果你不确定文件的编码格式,可以安装第三方库 `chardet` 来检测:
```bash
pip install chardet
```
然后运行以下代码:
```python
import chardet
with open('file.csv', 'rb') as f:
result = chardet.detect(f.read())
print(result) 查看文件的编码信息
```
搞定编码问题后,一切都会恢复正常啦!💪✨
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。