本地的html文件里的表格,如何导入到excel?
232 8
[1 楼] 无计留春住 [泡菜]
22-1-6 16:19
用lansee查看局域网电脑,保存下来的是本地htm文件,打开后里面是个表格,如何把这个表格导入到excel?
[9 楼] 老鼠不相往来 [泡菜]
22-1-8 10:25
无计留春住 发表于 2022-01-06 17:13
这样做全挤在一个单元格里

不知道了,我这里网页普通表格拷贝会自动分行列,除非html表格不规范
发布自 安卓客户端
[8 楼] camson [禁言中]
22-1-7 17:10
无计留春住 发表于 2022-1-7 16:35
谢谢
不客气。
[7 楼] sjgzw [泡菜]
22-1-7 16:55
网页表格应该有table标签吧,直接用pathon爬虫,
很简单,俺给你个好用的。

import requests
from bs4 import BeautifulSoup
import pandas as pd
import time
import os

# URL、编码
page_url = r"https://www.baidu.com"
page_encode = r"utf-8"
excel_file = r"./Filename.xlsx"

# Get Web
res = requests.get(page_url)
res.encoding = page_encode
soup = BeautifulSoup(res.content, "lxml")

# Find table
table = soup.find("table")

# FileName_CurrentTime
c_time = time.strftime("%Y%m%d%H%m", time.localtime(time.time()))
(filename, extension) = os.path.splitext(excel_file)
filename_time = filename + "_" + c_time + extension

# Save Excel
datas = pd.read_html(table.prettify())
data = datas[0]
data.to_excel(filename_time, header=False, index=False)

[6 楼] 无计留春住 [泡菜]
22-1-7 16:35
camson 发表于 2022-1-6 17:50
看看这个:
https://probiztechnology·com/blog/2012/09/excel-2007-2010-tip-how-to-import-html-tables-into-excel/

https://www·convertcsv·com/html-table-to-csv.htm


谢谢
[5 楼] 至暗时刻 [禁言中]
22-1-6 21:08
这种我都是复制为纯文本, 然后用正则表达式进行各种查找替换, 直到满意为止.
[4 楼] camson [禁言中]
22-1-6 17:50
看看这个:
https://probiztechnology.com/blog/2012/09/excel-2007-2010-tip-how-to-import-html-tables-into-excel/

https://www.convertcsv.com/html-table-to-csv.htm
[3 楼] 无计留春住 [泡菜]
22-1-6 17:13
老鼠不相往来 发表于 2022-1-6 16:32
html里的表格格式规范的话浏览器里选中表格ctrl_c,到execl里ctrl_v就行


这样做全挤在一个单元格里
[2 楼] 老鼠不相往来 [泡菜]
22-1-6 16:32
html里的表格格式规范的话浏览器里选中表格ctrl_c,到execl里ctrl_v就行
发布自 安卓客户端