有个python上的问题

附上原因：
最近不想再用 calibre 来观看 epub 格式的漫画了，因为它不能同屏显示两页。
我想提取里面的图片出来，然后用蜂蜜浏览器来观看。提取倒是很简单，直接把 epub 后缀改为 zip 就可以解压，然后就可以看到里面的图片。
但是，问题来了，里面的图片并不是按照顺序排的。所以直接提取我就没法正常观看了……
所以我研究了一番，找到了解决方案。
分析
我发现里面有 html 和 image 这两个文件夹，每一个 html 文件里面，都存放着图片的名字。而 html 的文件名是按 1.html 2.html ... 100.html 这样排序的。
那么我岂不是可以通过遍历，查找 html 里面图片的名字，然后再到 image 文件夹里面，将图片的名字改为 html 的名字。例如，1.html 里面的图片是 xxx-9527.jpg ，我就将它改为 1.html.jpg 。
实现
通过 for i in os.listdir() 查找每一个 html 文件里的文本，然后去修改对应图片的名字。
于是我通过 rename.py 这个脚本实现了这个功能。
与此同时我还写了 unzip_file.py 这个脚本来实现批量将 epub 文件解压的功能。

然后是两个代码：
import os
import re
# 填写网页中有漫画时才有的文字，例如域名
string_in_html = 'xxx.com'
# 填写解压好后文件夹的位置
os.chdir(r'F:\wufa')
current_working_dir = os.getcwd()
for j in os.listdir():
os.chdir(current_working_dir)
# 判断是否文件夹，是则将工作目录
if os.path.isdir(j):
os.chdir(current_working_dir+'/'+j)
print(os.getcwd())
for i in os.listdir("html"):
# 读取文本
f = open("html/" + i, encoding="utf-8").read()
# 判断文本中是否存在某些字符串
if string_in_html in f:
# print('网页中存在图片链接')
# 查找图片的文件名，此处我的是网页中的图片名字是 xxx.com-12345.jgp 这种格式。下方的 \d+ 指正则表达式中的一串数字。
name = re.findall(string_in_html+r'-\d+.jpg', f)[0]
if os.path.exists('image/' + name):
os.rename("image/" + name, "image/" + i + ".jpg")

西安顺逸网络科技有限公司

代码生成器。账号新号独享。全新推特账号一人号代码生成器。使用，推特账号手机验证问题代码生成器。账号在线代发

2025-04-24 07:33广告

立即查看

import os
import zipfile
# 下方填写 epub 文件放置的文件夹
os.chdir(r'F:\xxxx')
for file in os.listdir():
if file.endswith(".epub"):
dir_name = file + ".unzip"
os.makedirs(dir_name)
zFile = zipfile.ZipFile(file, "r")
# ZipFile.namelist(): 获取ZIP文档内所有文件的名称列表
for fileM in zFile.namelist():
zFile.extract(fileM, dir_name)
zFile.close()
print("解压完成："+file)

因为是抄别人的，所以有些代码看不大懂，有没有大佬解释一下。

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

3回复贴，共1页

<<返回代码吧

分享到:

日	一	二	三	四	五	六