在这个案例中,我们将使用Jupyter Notebook来结合SQL和Python进行数据分析
首先,确保已经安装了必要的库。在Jupyter Notebook中运行以下命令:!pip install pandas!pip install sqlite3!pip install ipython-sql导入所需的库:import pandas as pdimport sqlite3from IPython.display import display%load_ext sql创建一个SQLite数据库并连接到它:conn = sqlite3.connect('example.db')使用魔法命令%sql连接到数据库:%sql sqlite:///example.db创建一个表格并插入数据:%%sqlCREATE TABLE sales ( id INTEGER PRIMARY KEY, product TEXT, price REAL, quantity INTEGER, date TEXT);INSERT INTO sales (product, price, quantity, date) VALUES ('Product A', 10.0, 5, '2021-01-01'), ('Product B', 20.0, 10, '2021-01-01'), ('Product A', 10.0, 15, '2021-01-02'), ('Product B', 20.0, 20, '2021-01-02');使用SQL查询数据并将结果存储在Pandas DataFrame中:result = %sql SELECT * FROM sales;df = result.DataFrame()display(df)使用Python对数据进行进一步处理。例如,计算每个产品的总销售额:sales_summary = df.groupby('product').sum().reset_index()sales_summary['total_sales'] = sales_summary['price'] * sales_summary['quantity']display(sales_summary)关闭数据库连接:conn.close()这个简单的案例展示了如何在Jupyter Notebook中结合SQL和Python进行数据分析。你可以根据自己的需求修改代码,以处理更复杂的数据和查询。




