跳到内容
  • 福昕首页
  • 开发中心
  • SDK文档资料
  • 福昕首页
  • 开发中心
  • SDK文档资料
申请试用
  • 企业自动化
    • Compressor
  • 福昕CloudAPI
  • 福昕PDF SDK 软件开发工具包
    • 福昕PDF SDK(ActiveX)
    • 福昕PDF SDK(桌面/服务器)
    • 福昕PDF SDK(Plug-in)
    • 福昕 PDF SDK(安卓)
    • 福昕PDF SDK(iOS)
    • 福昕PDF SDK(Web)
  • 福昕管理控制台
    • 公有云
    • 私有云
    • 通用情况
  • 福昕阅读器
    • RMS插件
  • 福昕高级编辑器
    • AI助手
    • Mac版本
      • 常规问题
    • windows版本
      • ECM集成
      • 互联PDF
      • 企业管理指南
      • 保护
      • 内容编辑
      • 创建PDF
      • 压缩
      • 图章
      • 安装与卸载
      • 常见问题
      • 打印
      • 注释/评论
      • 福昕插件
      • 翻译助手
      • 翻译助手教程
      • 试用与激活
      • 转换
      • 页面管理
    • 教育用户
      • 论文查重
      • 论文畅
    • 网页版
      • 电子签章
    • 订阅
    • 资源
  • 福昕高级编辑器Linux版本
  • 福船图纸管理系统
  • 福昕PDF SDK 软件开发工具包 > 福昕PDF SDK(桌面/服务器)
  • 标签:
  • 图形对象,图片,复制,文本,新PDF,方形注释,注释,目标注释,矩形框注释

高效实现PDF矩形注释区域内容提取

  • 福昕知识库
  • 2025-05-28

用户需求解析:如何利用PDF SDK精准提取矩形标注框内的全部内容(图文混排)并生成新PDF文档?

public static void main(String[] args) throws PDFException {
        PDFDoc doc = new PDFDoc("annot.pdf");
            doc.load(null);
        PDFDoc newdoc = new PDFDoc();
        doc.load(null);
        PDFPage page = doc.getPage(0);
        RectF box = page.getBox(0);
        PDFPage newPage = newdoc.insertPage(0,1);
        newPage.setBox(0,box);
        newPage.startParse(0,null,true);

        newdoc.load(null);
            //拿到矩形内所有元素,复制到空白页面

        //PDFPage pdfPage = doc.insertPage(1, 1);
        //pdfPage.startParse(0,null,true);
        page.startParse(0,null,true);
        int annotCount = page.getAnnotCount();
        OCR ocr = new OCR();
        System.out.println(annotCount);
        for (int i = 0; i < annotCount; i++) {
            Annot annot = page.getAnnot(i);
            if(e_Square == annot.getType()){
                RectF rect = annot.getRect();
                GraphicsObjectArray graphicsObjectsAtRectangle = page.getGraphicsObjectsAtRectangle(rect, 0);
                int size = graphicsObjectsAtRectangle.getSize();
                for (int j = 0; j < size; j++) {
                    GraphicsObject gObj = graphicsObjectsAtRectangle.getAt(j);
                    newPage.insertGraphicsObject(newPage.getLastGraphicsObjectPosition(0), gObj.clone(page,newPage));
                }


                newPage.generateContent();
            }
        }

        newdoc.saveAs("annot_test.pdf",e_SaveFlagRemoveRedundantObjects);

技术实现流程:

  • ​目标注释筛选​:通过SDK遍历原始PDF首页注释列表,精准定位e_Square类型(方形标注框)的坐标区域
  • 图形对象提取​:针对每个方形注释的边界范围,智能抓取区域内所有可视元素(包括矢量图形、文本图层、嵌入图像等)
  • ​内容复制到新PDF​:将捕获的视觉元素按原始坐标系统无损移植到新PDF画布,确保像素级精度输出至annot_test.pdf文件

相关内容

编辑器中如何设置不同文档权限保护策略

Linux版本中如何获取电脑的UUID信息

编辑器中如何使用密码保护功能

专业获取当前页面截图的技术实现方案

PDF文档关键词搜索替换功能的技术实现方案

基于HTTP范围请求的非事件监听式PDF注释数据自动导入方案

基于ActiveX控件的高效PDF阅读水印实现方案

Web SDK UIExtension 右键菜单深度定制指南(基于jQuery-contextMenu)

如何分别自定义文本类型注释(打字机/文本框/注释框)的默认样式属性

在WebSDK实现放置签名

推荐内容

编辑器中如何设置不同文档权限保护策略

Linux版本中如何获取电脑的UUID信息

编辑器中如何使用密码保护功能

专业获取当前页面截图的技术实现方案

PDF文档关键词搜索替换功能的技术实现方案

基于HTTP范围请求的非事件监听式PDF注释数据自动导入方案

基于ActiveX控件的高效PDF阅读水印实现方案

Web SDK UIExtension 右键菜单深度定制指南(基于jQuery-contextMenu)

如何分别自定义文本类型注释(打字机/文本框/注释框)的默认样式属性

在WebSDK实现放置签名

产品
  • 应用行业
  • 白皮书
开发支持
  • 开发中心
  • SDK文档资料

销售咨询:010-50951668

客服电话:0591-38509808

销售咨询
微信公众号

©2025 福建福昕软件开发股份有限公司 版权所有

隐私策略