網友評分: 5分
PDFlux 是一款專業的PDF表格智能提取神器,目前有支持macOS、Windows系統、小程序以及瀏覽器插件,可以一鍵識別、一鍵提取PDF、掃描件、圖片中的表格、文本段落、圖片等要素!
表格識別:
精準識別無線框表格
精準識別復雜排版頁面的表格
精準識別表格內部單元格合并
跨頁表格自動合并
支持掃描件的表格識別:去除印章、角度矯正
格式轉換:
將PDF轉化為Word、Excel、HTML等格式
將PDF轉化為EPUB、MOBI等電子書格式,可以在手機或Kindle等電紙書上閱讀
精準保留文本段落、表格等內容塊信息
精準識別文檔的章節目錄結構
支持復雜排版的PDF文檔的轉換
SaaS服務:
提供一套完整易用的REST API,供計算機調用,讓您把PDF復雜格式拋諸腦后
將PDF文檔解析為文本段落、表格、圖片等內容塊的序列,保留原文檔的閱讀順序
支持中英文多欄復雜排版的PDF文檔解析,跨欄和跨頁內容塊智能自動合并
智能識別表格的內部結構:單元格合并,單元格文字的對齊方式、縮進、顏色、加粗、斜體等樣式信息,跨頁和跨欄表格智能合并單元格文字
智能識別文檔的目錄結構,支持多達10個層級,長文檔信息抽取必不可少
支撐后續各類文檔智能的應用:PDF文檔全文檢索、文檔級別信息抽取等
1、增加金幣贈送機制說明
2、增加PDF文檔版本對比工具,支持PDF、掃描件交叉對比,超長文檔極速處理、可視化呈現差異結果
3、優化部分UI和交互細節,延長自動退出登錄時長
標簽: