NLTK库可以通过使用align_words函数对文本进行对齐。以下是一个示例代码:
from nltk.translate import AlignedSentfrom nltk.translate import Alignmentsrc_words = ['I', 'saw', 'the', 'man']tgt_words = ['Je', 'ai', 'vu', 'l', 'homme']alignment = Alignment([(0, 0), (1, 1), (2, 2), (3, 3)])aligned_sent = AlignedSent(src_words, tgt_words, alignment)print(aligned_sent.words)print(aligned_sent.mots)print(aligned_sent.alignment)在这个示例中,我们创建了一个包含源语言单词列表和目标语言单词列表的AlignedSent对象,然后打印出对齐后的结果。您也可以使用Alignment()函数来指定单词之间的对应关系,以生成自定义的对齐结果。


