文档清洗系统脚本修改
This commit is contained in:
File diff suppressed because it is too large
Load Diff
File diff suppressed because it is too large
Load Diff
1034
cxs/doc_cleaner.py
Normal file
1034
cxs/doc_cleaner.py
Normal file
File diff suppressed because it is too large
Load Diff
14
cxs/main.py
14
cxs/main.py
@@ -464,7 +464,12 @@ async def process_single_file(file_path: str, cleaner: DocCleaner) -> tuple[str,
|
||||
|
||||
# 合并正文和附录内容用于返回
|
||||
all_content = main_content + ["附录"] + appendix if appendix else main_content
|
||||
text_content = " ".join([t.replace("\n", " ").strip() for t in all_content if t.strip()])
|
||||
# 增加类型检查,确保只对字符串类型调用strip()方法
|
||||
text_content = " ".join([
|
||||
t.replace("\n", " ").strip() if isinstance(t, str) else str(t)
|
||||
for t in all_content
|
||||
if (isinstance(t, str) and t.strip()) or not isinstance(t, str)
|
||||
])
|
||||
|
||||
# 验证所有文件是否成功创建
|
||||
if not output_file.exists():
|
||||
@@ -487,10 +492,11 @@ async def process_single_file(file_path: str, cleaner: DocCleaner) -> tuple[str,
|
||||
print(f"清理图片目录时出错: {str(cleanup_error)}")
|
||||
|
||||
try:
|
||||
if temp_docx and os.path.exists(temp_docx):
|
||||
# 添加类型检查,确保temp_docx是字符串类型
|
||||
if temp_docx and isinstance(temp_docx, (str, Path)) and os.path.exists(str(temp_docx)):
|
||||
print(f"清理临时DOCX文件: {temp_docx}")
|
||||
safe_delete_file(temp_docx) # 使用安全删除函数
|
||||
temp_dir = os.path.dirname(temp_docx)
|
||||
safe_delete_file(str(temp_docx)) # 确保传递字符串参数
|
||||
temp_dir = os.path.dirname(str(temp_docx))
|
||||
if os.path.exists(temp_dir):
|
||||
try:
|
||||
os.rmdir(temp_dir)
|
||||
|
||||
Binary file not shown.
|
Before Width: | Height: | Size: 70 KiB |
File diff suppressed because it is too large
Load Diff
File diff suppressed because one or more lines are too long
@@ -1,14 +1,3 @@
|
||||
# 文档内容
|
||||
|
||||
|
||||
【文档信息】
|
||||
|
||||
作者: Lenovo
|
||||
|
||||
创建时间: 2025-05-15 08:30:10
|
||||
|
||||
修改时间: 2025-05-15 08:30:25
|
||||
|
||||
1111
|
||||
|
||||
【图片识别文本】
|
||||
@@ -32,38 +21,4 @@
|
||||
清 理 所 有 临 时 文 件 , 不 会 影 响 系 统 功 能 。
|
||||
|
||||
以 上 优 化 星 觞 失 了 临 时 文 伟 删 除 问 题 , 又 保 持 了 系 统 的
|
||||
稳 定 性 , 让 您 能 雪 顺 畅 地 处 理 Bxcel 文 件 。
|
||||
|
||||
|
||||
## 图片内容
|
||||
|
||||
|
||||
### 图片 1
|
||||
|
||||

|
||||
|
||||
|
||||
**OCR文本内容:**
|
||||
|
||||
“ 完 善 了 异 常 处 理 , 防 止 惑 时 目 录 券 除 失 败 导 致 程 序 崖
|
||||
澎
|
||||
澎
|
||||
|
||||
4. 更 新 README.md
|
||||
* 在 暨 近 更 新 部 分 记 录 了 临 时 文 件 处 理 机 制 的 改 进
|
||||
。 添 加 了 Excel 文 件 句 柄 管 理
|
||||
|
||||
使 用 说 明
|
||||
这 东 改 进 不 需 要 您 做 任 何 额 外 操 作 , 系 统 会 自 动 -
|
||||
1. 在 处 理 Excel 文 件 时 正 球 关 闭 文 件 句 柄
|
||||
|
||||
2 当 尝 试 删 除 文 件 通 刨 “ 文 件 被 占 用 “ 错 误 时 , 自 动 等 待
|
||||
并 重 试
|
||||
|
||||
3 即 使 无 法 券 除 临 时 文 件 , 也 不 影 响 处 #
|
||||
如 果 仍 然 通 到 惧 时 文 件 问 题 , 系 统 会 在 下 次 启 动 时 自 动
|
||||
清 理 所 有 临 时 文 件 , 不 会 影 响 系 统 功 能 。
|
||||
|
||||
以 上 优 化 星 觞 失 了 临 时 文 伟 删 除 问 题 , 又 保 持 了 系 统 的
|
||||
稳 定 性 , 让 您 能 雪 顺 畅 地 处 理 Bxcel 文 件 。
|
||||
|
||||
稳 定 性 , 让 您 能 雪 顺 畅 地 处 理 Bxcel 文 件 。
|
||||
@@ -1 +1 @@
|
||||
【文档信息】 作者: Lenovo 创建时间: 2025-05-15 08:30:10 修改时间: 2025-05-15 08:30:25 1111 【图片识别文本】 “ 完 善 了 异 常 处 理 , 防 止 惑 时 目 录 券 除 失 败 导 致 程 序 崖 澎 澎 4. 更 新 README.md * 在 暨 近 更 新 部 分 记 录 了 临 时 文 件 处 理 机 制 的 改 进 。 添 加 了 Excel 文 件 句 柄 管 理 使 用 说 明 这 东 改 进 不 需 要 您 做 任 何 额 外 操 作 , 系 统 会 自 动 - 1. 在 处 理 Excel 文 件 时 正 球 关 闭 文 件 句 柄 2 当 尝 试 删 除 文 件 通 刨 “ 文 件 被 占 用 “ 错 误 时 , 自 动 等 待 并 重 试 3 即 使 无 法 券 除 临 时 文 件 , 也 不 影 响 处 # 如 果 仍 然 通 到 惧 时 文 件 问 题 , 系 统 会 在 下 次 启 动 时 自 动 清 理 所 有 临 时 文 件 , 不 会 影 响 系 统 功 能 。 以 上 优 化 星 觞 失 了 临 时 文 伟 删 除 问 题 , 又 保 持 了 系 统 的 稳 定 性 , 让 您 能 雪 顺 畅 地 处 理 Bxcel 文 件 。
|
||||
1111 【图片识别文本】 “ 完 善 了 异 常 处 理 , 防 止 惑 时 目 录 券 除 失 败 导 致 程 序 崖 澎 澎 4. 更 新 README.md * 在 暨 近 更 新 部 分 记 录 了 临 时 文 件 处 理 机 制 的 改 进 。 添 加 了 Excel 文 件 句 柄 管 理 使 用 说 明 这 东 改 进 不 需 要 您 做 任 何 额 外 操 作 , 系 统 会 自 动 - 1. 在 处 理 Excel 文 件 时 正 球 关 闭 文 件 句 柄 2 当 尝 试 删 除 文 件 通 刨 “ 文 件 被 占 用 “ 错 误 时 , 自 动 等 待 并 重 试 3 即 使 无 法 券 除 临 时 文 件 , 也 不 影 响 处 # 如 果 仍 然 通 到 惧 时 文 件 问 题 , 系 统 会 在 下 次 启 动 时 自 动 清 理 所 有 临 时 文 件 , 不 会 影 响 系 统 功 能 。 以 上 优 化 星 觞 失 了 临 时 文 伟 删 除 问 题 , 又 保 持 了 系 统 的 稳 定 性 , 让 您 能 雪 顺 畅 地 处 理 Bxcel 文 件 。
|
||||
Binary file not shown.
Binary file not shown.
Binary file not shown.
|
Before Width: | Height: | Size: 70 KiB |
Reference in New Issue
Block a user