У меня есть база данных с тоннами PDF документов, встроенных как OLE объекты в поля Notes RichText. Они не совместимы с XPages, поэтому мне нужно преобразовать OLE-объекты в файлы (вложения). Как я могу сделать это в автоматическом режиме (я знаю, что это должно выполняться в клиенте Notes (так ли это?) - или есть POI способ извлечь их?
Уточнение
Я могу извлечь блоб (в память, если хочу), но запись его на диск не создает PDF файл, так как этот блоб является OLE контейнером. Таким образом, я вижу 2 возможных пути:
Но я не использовал ни один из этих подходов и хотел узнать, может ли какой-нибудь совет сэкономить мне часы тестов.
Возможно ли это с помощью инструментов dxl? Я работал с экспортером dxl для извлечения встроенных изображений из документа, может быть, это можно сделать и с ole objects?
Я использовал немного измененную версию объекта EmbeddedImage из проекта золотой коллекции lotusscript на openntf.
Эта библиотека содержит объект Embeddedimagelist, который ищет в DXL теги картинок и пытается разобрать их содержимое. Возможно, это будет применимо и к встроенным объектам ole.
Я'думаю, что что-то вроде поиска %PDF и последующего сохранения всего в виде файла должно дать вам PDF. Теоретически в OLE-файле может быть куча всего, но в большинстве случаев вы получите файл просто с префиксом OLE-заголовка (или как он там называется).
Я'использовал этот подход в одном случае (не для PDF, хотя) и, кажется, он работал нормально.
Полагаю, на этом основан подход openntf, о котором говорит jjtbsomhorst :-)