我正在为我的论文构建一个BibTeX文件。在这个过程中,我把那个Bib文件复制到另一个我必须制作的文件中,我必须在原始文件的副本中添加一些新的引文。
现在我有两个文献档案,它们有很多共同点,但在一些引文上有所不同。有什么方法可以合并它们吗?这样我就有一个单一的文件,其中有两个文件的所有引文,但没有重复的内容?
我认为没有简单的方法可以做到这一点。虽然有可能写一个perl脚本,用regex来做这件事。但问题是
1.有时两个条目是重复的,尽管它们并不完全相同,例如,标题中不同的大写字母或额外的{
和}
。所以我们必须通过定义一些差异的阈值来解决这个问题。
2.2. 有时,同一作者在同一年的两个条目在标题上有一点差别,但确实是两篇论文。这使得(1)中的阈值难以定义。
所以我建议你只能用手来做这个。一个相对简单的方法是使用BibTeX编辑器,例如Mac OS X上的BibDesk,将两个文件导入其中,当两个条目有相同的引证码时,它会警告你。因此,对于那些具有相同引文关键字的条目,几乎可以肯定是重复的,你可以很容易地将它们清理掉。如果我没记错的话,BibDesk和其他编辑器确实有这个功能。在这之后,按标题对所有条目进行排序,并通过你的眼睛发现更多的重复。