Microsoft InfoPath
Microsoft InfoPath是用來開發以XML為基礎的表格的應用程式。於2003年末首次發布作為微軟Office 2003套餐程式的一部分。InfoPath主要特點是它對自訂的XML概要支援,以創作和查驗XML文件的能力。它可透過MSXML與SOAP工具包利用XML Web Services連…
论文标题:olmOCR: Unlocking Trillions of Tokens in PDFs with Vision Language Models
论文地址:https://arxiv.org/abs/2502.18443 [注] 先上结论:olmOCR是基于Qwen2-VL-7B-Instruct微调的模型,在微调时加入了PDF的一些元信息…