在Pandas中处理HTML数据,可以使用pd.read_html()函数来将HTML表格数据读取为DataFrame对象。这个函数将返回一个包含所有表格数据的列表,每个表格数据对应一个DataFrame对象。
以下是一个简单的示例:
import pandas as pd# 读取网页中的表格数据url = 'https://en.wikipedia.org/wiki/List_of_countries_by_past_and_future_population'tables = pd.read_html(url)# 打印第一个表格数据print(tables[0])这样就可以将网页中的表格数据读取为DataFrame对象,然后可以对数据进行进一步处理和分析。


