使用Google Gemini API将PDF文件翻译为中文HTML格式,同时提取图像,并支持生成EPUB电子书。
- 读取
input目录下的所有PDF文件 - 使用Google Gemini API将PDF内容翻译为中文
- 尽可能保持原PDF排版的同时,输出为HTML格式
- 提取PDF中的图像,并根据图片描述文本命名
- 将HTML和图像保存到
output目录 - 支持将多个HTML文件合并为一个EPUB电子书
- 使用config.yml配置API密钥和模型
- 安装依赖:
pip install -r requirements.txt - 将PDF文件放入
input目录 - 复制
config.yml.example文件为config.yml,设置API密钥和模型:# Gemini API配置 api_key: "your_api_key_here" # 替换为你的实际API密钥 base_url: "" #可以不用修改,保持为空 model: "gemini-2.5-flash-preview-04-17" # 使用的Gemini模型
- 运行翻译脚本:
python pdf_translator.py - 查看
output目录中的HTML和图像文件 - 运行EPUB生成脚本:
python html_to_epub.py - 在
epub目录中查看生成的EPUB文件
.
├── input/ # 存放待翻译的PDF文件
├── output/ # 存放翻译后的HTML和图像文件
├── epub/ # 存放生成的EPUB文件
├── pdf_translator.py # PDF翻译主程序
├── html_to_epub.py # EPUB生成程序
├── config.yml # 配置文件
└── requirements.txt # 依赖包列表
在config.yml中可以配置以下模型:
gemini-2.5-flash-preview-04-17- Gemini 2.5 Flash(快速响应)gemini-2.5-pro-preview-03-25- Gemini 2.5 Pro(更强大的理解能力)
生成的EPUB电子书具有以下特点:
- 自动合并所有HTML文件为一个EPUB
- 尽可能保持原文档的排版和样式
- 支持图片、表格等富媒体内容
- 自动生成目录
- 优化的中文排版和字体支持
- 响应式图片布局
- 需要Google Gemini API密钥
- 图像提取基于图片下方的描述文本
- 程序会自动创建所需的目录结构
- 使用google-generativeai库直接调用Gemini API
- 配置信息存储在config.yml文件中
- EPUB生成需要安装ebooklib和beautifulsoup4库