PDF翻译工具

使用Google Gemini API将PDF文件翻译为中文HTML格式，同时提取图像，并支持生成EPUB电子书。

功能

读取input目录下的所有PDF文件
使用Google Gemini API将PDF内容翻译为中文
尽可能保持原PDF排版的同时，输出为HTML格式
提取PDF中的图像，并根据图片描述文本命名
将HTML和图像保存到output目录
支持将多个HTML文件合并为一个EPUB电子书
使用config.yml配置API密钥和模型

使用方法

安装依赖：pip install -r requirements.txt
将PDF文件放入input目录

复制config.yml.example文件为config.yml，设置API密钥和模型：

# Gemini API配置
api_key: "your_api_key_here"  # 替换为你的实际API密钥
base_url: "" #可以不用修改，保持为空
model: "gemini-2.5-flash-preview-04-17"  # 使用的Gemini模型

运行翻译脚本：python pdf_translator.py
查看output目录中的HTML和图像文件
运行EPUB生成脚本：python html_to_epub.py
在epub目录中查看生成的EPUB文件

目录结构

.
├── input/          # 存放待翻译的PDF文件
├── output/         # 存放翻译后的HTML和图像文件
├── epub/          # 存放生成的EPUB文件
├── pdf_translator.py  # PDF翻译主程序
├── html_to_epub.py   # EPUB生成程序
├── config.yml     # 配置文件
└── requirements.txt  # 依赖包列表

可用的Gemini模型

在config.yml中可以配置以下模型：

gemini-2.5-flash-preview-04-17 - Gemini 2.5 Flash（快速响应）
gemini-2.5-pro-preview-03-25 - Gemini 2.5 Pro（更强大的理解能力）

EPUB功能

生成的EPUB电子书具有以下特点：

自动合并所有HTML文件为一个EPUB
尽可能保持原文档的排版和样式
支持图片、表格等富媒体内容
自动生成目录
优化的中文排版和字体支持
响应式图片布局

注意事项

需要Google Gemini API密钥
图像提取基于图片下方的描述文本
程序会自动创建所需的目录结构
使用google-generativeai库直接调用Gemini API
配置信息存储在config.yml文件中
EPUB生成需要安装ebooklib和beautifulsoup4库

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.gitignore		.gitignore
README.md		README.md
config.yml.example		config.yml.example
get_pdf_bookmark.py		get_pdf_bookmark.py
html_to_epub.py		html_to_epub.py
pdf_translator.py		pdf_translator.py
requirements.txt		requirements.txt
split_pdf.py		split_pdf.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

PDF翻译工具

功能

使用方法

目录结构

可用的Gemini模型

EPUB功能

注意事项

About

Uh oh!

Releases

Packages

Uh oh!

Languages

colin4k/gemini-pdf-translator

Folders and files

Latest commit

History

Repository files navigation

PDF翻译工具

功能

使用方法

目录结构

可用的Gemini模型

EPUB功能

注意事项

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages