pdf — community Claude_skills_zh-CN, community, ide skills, Claude Code, Cursor, Windsurf

v1.0.0

关于此技能

适合需要高级PDF处理能力的文档分析代理。 全面的 PDF 操作工具包,用于提取文本和表格、创建新 PDF、合并/拆分文档以及处理表单。当 Claude 需要填写 PDF 表单或以编程方式大规模处理、生成或分析 PDF 文档时使用。

LeastBit LeastBit
[0]
[0]
更新于: 3/11/2026

Killer-Skills Review

Decision support comes first. Repository text comes second.

Reference-Only Page Review Score: 4/11

This page remains useful for operators, but Killer-Skills treats it as reference material instead of a primary organic landing page.

Concrete use-case guidance Explicit limitations and caution
Review Score
4/11
Quality Score
36
Canonical Locale
zh
Detected Body Locale
zh

适合需要高级PDF处理能力的文档分析代理。 全面的 PDF 操作工具包,用于提取文本和表格、创建新 PDF、合并/拆分文档以及处理表单。当 Claude 需要填写 PDF 表单或以编程方式大规模处理、生成或分析 PDF 文档时使用。

核心价值

使代理能够使用Python库(如pypdf)执行基本的PDF操作,例如读取、写入和合并PDF文件,从而实现高效的文档处理和分析。

适用 Agent 类型

适合需要高级PDF处理能力的文档分析代理。

赋予的主要能力 · pdf

从PDF文档中提取文本
合并多个PDF文件到单个文档
自动化PDF表单填充

! 使用限制与门槛

  • 需要Python环境
  • 仅限基本PDF操作
  • 依赖于pypdf库

Why this page is reference-only

  • - Current locale does not satisfy the locale-governance contract.
  • - The page lacks a strong recommendation layer.
  • - The underlying skill quality score is below the review floor.

Source Boundary

The section below is supporting source material from the upstream repository. Use the Killer-Skills review above as the primary decision layer.

实验室 Demo

Browser Sandbox Environment

⚡️ Ready to unleash?

Experience this Agent in a zero-setup browser environment powered by WebContainers. No installation required.

Boot Container Sandbox

常见问题与安装步骤

以下问题与步骤与页面结构化数据保持一致,便于搜索引擎理解页面内容。

? FAQ

pdf 是什么?

适合需要高级PDF处理能力的文档分析代理。 全面的 PDF 操作工具包,用于提取文本和表格、创建新 PDF、合并/拆分文档以及处理表单。当 Claude 需要填写 PDF 表单或以编程方式大规模处理、生成或分析 PDF 文档时使用。

如何安装 pdf?

运行命令:npx killer-skills add LeastBit/Claude_skills_zh-CN/pdf。支持 Cursor、Windsurf、VS Code、Claude Code 等 19+ IDE/Agent。

pdf 适用于哪些场景?

典型场景包括:从PDF文档中提取文本、合并多个PDF文件到单个文档、自动化PDF表单填充。

pdf 支持哪些 IDE 或 Agent?

该技能兼容 Cursor, Windsurf, VS Code, Trae, Claude Code, OpenClaw, Aider, Codex, OpenCode, Goose, Cline, Roo Code, Kiro, Augment Code, Continue, GitHub Copilot, Sourcegraph Cody, and Amazon Q Developer。可使用 Killer-Skills CLI 一条命令通用安装。

pdf 有哪些限制?

需要Python环境;仅限基本PDF操作;依赖于pypdf库。

安装步骤

  1. 1. 打开终端

    在你的项目目录中打开终端或命令行。

  2. 2. 执行安装命令

    运行:npx killer-skills add LeastBit/Claude_skills_zh-CN/pdf。CLI 会自动识别 IDE 或 AI Agent 并完成配置。

  3. 3. 开始使用技能

    pdf 已启用,可立即在当前项目中调用。

! 参考页模式

此页面仍可作为安装与查阅参考,但 Killer-Skills 不再把它视为主要可索引落地页。请优先阅读上方评审结论,再决定是否继续查看上游仓库说明。

Imported Repository Instructions

The section below is supporting source material from the upstream repository. Use the Killer-Skills review above as the primary decision layer.

Supporting Evidence

pdf

安装 pdf,这是一款面向AI agent workflows and automation的 AI Agent Skill。支持 Claude Code、Cursor、Windsurf,一键安装。

SKILL.md
Readonly
Imported Repository Instructions
The section below is supporting source material from the upstream repository. Use the Killer-Skills review above as the primary decision layer.
Supporting Evidence

PDF 处理指南

概述

本指南涵盖使用 Python 库和命令行工具进行的基本 PDF 处理操作。有关高级功能、JavaScript 库和详细示例,请参阅 reference.md。如果需要填写 PDF 表单,请阅读 forms.md 并按照其说明操作。

快速开始

python
1from pypdf import PdfReader, PdfWriter 2 3# 读取 PDF 4reader = PdfReader("document.pdf") 5print(f"页数: {len(reader.pages)}") 6 7# 提取文本 8text = "" 9for page in reader.pages: 10 text += page.extract_text()

Python 库

pypdf - 基本操作

合并 PDF

python
1from pypdf import PdfWriter, PdfReader 2 3writer = PdfWriter() 4for pdf_file in ["doc1.pdf", "doc2.pdf", "doc3.pdf"]: 5 reader = PdfReader(pdf_file) 6 for page in reader.pages: 7 writer.add_page(page) 8 9with open("merged.pdf", "wb") as output: 10 writer.write(output)

拆分 PDF

python
1reader = PdfReader("input.pdf") 2for i, page in enumerate(reader.pages): 3 writer = PdfWriter() 4 writer.add_page(page) 5 with open(f"page_{i+1}.pdf", "wb") as output: 6 writer.write(output)

提取元数据

python
1reader = PdfReader("document.pdf") 2meta = reader.metadata 3print(f"标题: {meta.title}") 4print(f"作者: {meta.author}") 5print(f"主题: {meta.subject}") 6print(f"创建者: {meta.creator}")

旋转页面

python
1reader = PdfReader("input.pdf") 2writer = PdfWriter() 3 4page = reader.pages[0] 5page.rotate(90) # 顺时针旋转90度 6writer.add_page(page) 7 8with open("rotated.pdf", "wb") as output: 9 writer.write(output)

pdfplumber - 文本和表格提取

提取带布局的文本

python
1import pdfplumber 2 3with pdfplumber.open("document.pdf") as pdf: 4 for page in pdf.pages: 5 text = page.extract_text() 6 print(text)

提取表格

python
1with pdfplumber.open("document.pdf") as pdf: 2 for i, page in enumerate(pdf.pages): 3 tables = page.extract_tables() 4 for j, table in enumerate(tables): 5 print(f"第 {i+1} 页的表格 {j+1}:") 6 for row in table: 7 print(row)

高级表格提取

python
1import pandas as pd 2 3with pdfplumber.open("document.pdf") as pdf: 4 all_tables = [] 5 for page in pdf.pages: 6 tables = page.extract_tables() 7 for table in tables: 8 if table: # 检查表格是否为空 9 df = pd.DataFrame(table[1:], columns=table[0]) 10 all_tables.append(df) 11 12# 合并所有表格 13if all_tables: 14 combined_df = pd.concat(all_tables, ignore_index=True) 15 combined_df.to_excel("extracted_tables.xlsx", index=False)

reportlab - 创建 PDF

基本 PDF 创建

python
1from reportlab.lib.pagesizes import letter 2from reportlab.pdfgen import canvas 3 4c = canvas.Canvas("hello.pdf", pagesize=letter) 5width, height = letter 6 7# 添加文本 8c.drawString(100, height - 100, "Hello World!") 9c.drawString(100, height - 120, "这是用 reportlab 创建的 PDF") 10 11# 添加线条 12c.line(100, height - 140, 400, height - 140) 13 14# 保存 15c.save()

创建多页 PDF

python
1from reportlab.lib.pagesizes import letter 2from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, PageBreak 3from reportlab.lib.styles import getSampleStyleSheet 4 5doc = SimpleDocTemplate("report.pdf", pagesize=letter) 6styles = getSampleStyleSheet() 7story = [] 8 9# 添加内容 10title = Paragraph("报告标题", styles['Title']) 11story.append(title) 12story.append(Spacer(1, 12)) 13 14body = Paragraph("这是报告的正文内容。" * 20, styles['Normal']) 15story.append(body) 16story.append(PageBreak()) 17 18# 第2页 19story.append(Paragraph("第2页", styles['Heading1'])) 20story.append(Paragraph("第2页的内容", styles['Normal'])) 21 22# 构建 PDF 23doc.build(story)

命令行工具

pdftotext (poppler-utils)

bash
1# 提取文本 2pdftotext input.pdf output.txt 3 4# 提取文本并保留布局 5pdftotext -layout input.pdf output.txt 6 7# 提取指定页面 8pdftotext -f 1 -l 5 input.pdf output.txt # 第1-5页

qpdf

bash
1# 合并 PDF 2qpdf --empty --pages file1.pdf file2.pdf -- merged.pdf 3 4# 拆分页面 5qpdf input.pdf --pages . 1-5 -- pages1-5.pdf 6qpdf input.pdf --pages . 6-10 -- pages6-10.pdf 7 8# 旋转页面 9qpdf input.pdf output.pdf --rotate=+90:1 # 将第1页旋转90度 10 11# 移除密码 12qpdf --password=mypassword --decrypt encrypted.pdf decrypted.pdf

pdftk(如果可用)

bash
1# 合并 2pdftk file1.pdf file2.pdf cat output merged.pdf 3 4# 拆分 5pdftk input.pdf burst 6 7# 旋转 8pdftk input.pdf rotate 1east output rotated.pdf

常见任务

从扫描的 PDF 提取文本

python
1# 需要安装: pip install pytesseract pdf2image 2import pytesseract 3from pdf2image import convert_from_path 4 5# 将 PDF 转换为图像 6images = convert_from_path('scanned.pdf') 7 8# 对每一页进行 OCR 识别 9text = "" 10for i, image in enumerate(images): 11 text += f"第 {i+1} 页:\n" 12 text += pytesseract.image_to_string(image) 13 text += "\n\n" 14 15print(text)

添加水印

python
1from pypdf import PdfReader, PdfWriter 2 3# 创建水印(或加载现有的) 4watermark = PdfReader("watermark.pdf").pages[0] 5 6# 应用到所有页面 7reader = PdfReader("document.pdf") 8writer = PdfWriter() 9 10for page in reader.pages: 11 page.merge_page(watermark) 12 writer.add_page(page) 13 14with open("watermarked.pdf", "wb") as output: 15 writer.write(output)

提取图像

bash
1# 使用 pdfimages (poppler-utils) 2pdfimages -j input.pdf output_prefix 3 4# 这会将所有图像提取为 output_prefix-000.jpg、output_prefix-001.jpg 等

密码保护

python
1from pypdf import PdfReader, PdfWriter 2 3reader = PdfReader("input.pdf") 4writer = PdfWriter() 5 6for page in reader.pages: 7 writer.add_page(page) 8 9# 添加密码 10writer.encrypt("userpassword", "ownerpassword") 11 12with open("encrypted.pdf", "wb") as output: 13 writer.write(output)

快速参考

任务最佳工具命令/代码
合并 PDFpypdfwriter.add_page(page)
拆分 PDFpypdf每页一个文件
提取文本pdfplumberpage.extract_text()
提取表格pdfplumberpage.extract_tables()
创建 PDFreportlabCanvas 或 Platypus
命令行合并qpdfqpdf --empty --pages ...
OCR 扫描 PDFpytesseract先转换为图像
填写 PDF 表单pdf-lib 或 pypdf(参见 forms.md)参见 forms.md

后续步骤

  • 有关 pypdfium2 的高级用法,请参阅 reference.md
  • 有关 JavaScript 库(pdf-lib),请参阅 reference.md
  • 如果需要填写 PDF 表单,请按照 forms.md 中的说明操作
  • 有关故障排除指南,请参阅 reference.md

相关技能

寻找 pdf 的替代方案 (Alternative) 或可搭配使用的同类 community Skill?探索以下相关开源技能。

查看全部

openclaw-release-maintainer

Logo of openclaw
openclaw

Your own personal AI assistant. Any OS. Any Platform. The lobster way. 🦞

333.8k
0
AI

widget-generator

Logo of f
f

为prompts.chat的信息反馈系统生成可定制的插件小部件

149.6k
0
AI

flags

Logo of vercel
vercel

React 框架

138.4k
0
浏览器

pr-review

Logo of pytorch
pytorch

Python中具有强大GPU加速的张量和动态神经网络

98.6k
0
开发者工具