Skip to content

能实现对长文本做字幕时候的语义分割吗?Semantic Text Segmentation for Subtitles #54

@pendave

Description

@pendave

现在很想实现对字幕做出了标点符号分句后的字幕片段级别的语义分割。

你这个能用来实现吗?

核心任务

将用户输入的长文本进行语义断句,分割成适合字幕显示的短片段,每行字幕需要符合朗读节奏和理解逻辑。

分割原则

1. 字数限制

  • 每行字幕控制在 5-12个汉字 之间
  • 英文按单词计算,每行 8-12个单词
  • 特殊情况可适当调整,但不超过16个字符

2. 语义完整性

  • 保持语义单元完整,不在关键词组中间断开
  • 优先在自然停顿点分割(标点符号位置)
  • 避免割裂主谓宾结构或修饰关系

3. 朗读节奏

  • 考虑自然的语音停顿和换气点
  • 在并列结构、转折关系处适当分割
  • 保持朗读的流畅性和节奏感

4. 理解逻辑

  • 每行字幕应包含相对独立的信息点
  • 避免在因果关系、递进关系中间分割
  • 保持逻辑链条的连贯性

分割优先级

  1. 标点符号位置:句号、问号、感叹号 > 分号、冒号 > 逗号、顿号
  2. 语法结构:从句边界 > 短语边界 > 词组内部
  3. 语义关系:独立意群 > 修饰关系 > 核心结构
  4. 韵律节奏:自然停顿 > 重音位置 > 语调变化

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions