本地的html文件里的表格,如何导入到excel?
232
8
[1 楼] 无计留春住
[泡菜]
22-1-6 16:19
用lansee查看局域网电脑,保存下来的是本地htm文件,打开后里面是个表格,如何把这个表格导入到excel?
|
[9 楼] 老鼠不相往来
[泡菜]
22-1-8 10:25
无计留春住 发表于 2022-01-06 17:13 不知道了,我这里网页普通表格拷贝会自动分行列,除非html表格不规范 发布自 安卓客户端 |
[8 楼] camson
[禁言中]
22-1-7 17:10
|
[7 楼] sjgzw
[泡菜]
22-1-7 16:55
网页表格应该有table标签吧,直接用pathon爬虫,
很简单,俺给你个好用的。 import requests from bs4 import BeautifulSoup import pandas as pd import time import os # URL、编码 page_url = r"https://www.baidu.com" page_encode = r"utf-8" excel_file = r"./Filename.xlsx" # Get Web res = requests.get(page_url) res.encoding = page_encode soup = BeautifulSoup(res.content, "lxml") # Find table table = soup.find("table") # FileName_CurrentTime c_time = time.strftime("%Y%m%d%H%m", time.localtime(time.time())) (filename, extension) = os.path.splitext(excel_file) filename_time = filename + "_" + c_time + extension # Save Excel datas = pd.read_html(table.prettify()) data = datas[0] data.to_excel(filename_time, header=False, index=False) |
[6 楼] 无计留春住
[泡菜]
22-1-7 16:35
|
[5 楼] 至暗时刻
[禁言中]
22-1-6 21:08
这种我都是复制为纯文本, 然后用正则表达式进行各种查找替换, 直到满意为止.
|
[4 楼] camson
[禁言中]
22-1-6 17:50
看看这个:
https://probiztechnology.com/blog/2012/09/excel-2007-2010-tip-how-to-import-html-tables-into-excel/ https://www.convertcsv.com/html-table-to-csv.htm |
[3 楼] 无计留春住
[泡菜]
22-1-6 17:13
|
[2 楼] 老鼠不相往来
[泡菜]
22-1-6 16:32
html里的表格格式规范的话浏览器里选中表格ctrl_c,到execl里ctrl_v就行
发布自 安卓客户端 |