from transformers import pipeline

classifier = pipeline(task="audio-classification", model="superb/hubert-base-superb-er")
preds = classifier("https://huggingface.co/datasets/Narsil/asr_dummy/resolve/main/mlk.flac")
preds = [{"score": round(pred["score"], 4), "label": pred["label"]} for pred in preds]

from transformers import pipeline

transcriber = pipeline(task="automatic-speech-recognition", model="openai/whisper-small")
transcriber("https://huggingface.co/datasets/Narsil/asr_dummy/resolve/main/mlk.flac")

from transformers import pipeline

classifier = pipeline(task="image-classification")
preds = classifier("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg")
preds = [{"score": round(pred["score"], 4), "label": pred["label"]} for pred in preds]
print(*preds, sep="\n")

from transformers import pipeline

detector = pipeline(task="object-detection")
preds = detector("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg")
preds = [{"score": round(pred["score"], 4), "label": pred["label"], "box": pred["box"]} for pred in preds]

from transformers import pipeline

segmenter = pipeline(task="image-segmentation")
preds = segmenter("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg")
preds = [{"score": round(pred["score"], 4), "label": pred["label"]} for pred in preds]
print(*preds, sep="\n")

from transformers import pipeline

depth_estimator = pipeline(task="depth-estimation")
depth_estimator("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg")

from transformers import pipeline

classifier = pipeline(task="sentiment-analysis")
preds = classifier("Hugging Face 是自切片面包以来最好的东西！")
preds = [{"score": round(pred["score"], 4), "label": pred["label"]} for pred in preds]

from transformers import pipeline

classifier = pipeline(task="ner")
preds = classifier("Hugging Face 是一家总部位于纽约市的法国公司。")
preds = [
    {
        "entity": pred["entity"],
        "score": round(pred["score"], 4),
        "index": pred["index"],
        "word": pred["word"],
        "start": pred["start"],
        "end": pred["end"],
    }
    for pred in preds
]
print(*preds, sep="\n")

from transformers import pipeline

question_answerer = pipeline(task="question-answering")
preds = question_answerer(
    question="仓库的名称是什么？",
    context="仓库的名称是 huggingface/transformers",
)
print(
    f"score: {round(preds['score'], 4)}, start: {preds['start']}, end: {preds['end']}, answer: {preds['answer']}"
)

from transformers import pipeline

summarizer = pipeline(task="summarization")
summarizer(
    "在本文中，我们介绍了 Transformer，这是一种完全基于注意力机制的序列转换模型，取代了编码器-解码器架构中最常用的循环层，使用多头自注意力。对于翻译任务，Transformer 可以显著更快地进行训练，优于基于循环或卷积层的架构。在 WMT 2014 英语到德语和 WMT 2014 英语到法语的翻译任务中，我们达到了新的最先进水平。在前一个任务中，我们的最佳模型优于所有先前报告的集成模型。"
)

from transformers import pipeline

text = "将英文翻译成法文：Hugging Face 是一个以社区为基础的开源机器学习平台。"
translator = pipeline(task="translation", model="google-t5/t5-small")
translator(text)

from transformers import pipeline

prompt = "Hugging Face 是一个以社区为基础的开源机器学习平台。"
generator = pipeline(task="text-generation")
generator(prompt)  # doctest: +SKIP

from transformers import pipeline
from PIL import Image
import requests

url = "https://huggingface.co/datasets/hf-internal-testing/example-documents/resolve/main/jpeg_images/2.jpg"
image = Image.open(requests.get(url, stream=True).raw)

doc_question_answerer = pipeline("document-question-answering", model="magorshunov/layoutlm-invoices")
preds = doc_question_answerer(
    question="总金额是多少？",
    image=image,
)

🤗 Transformers 库能做什么¶

音频¶

音频分类¶

自动语音识别¶

计算机视觉¶

图像分类¶

目标检测¶

图像分割¶

深度估计¶

自然语言处理¶

文本分类¶

词分类¶

问答¶

摘要生成¶

翻译¶

语言建模¶

多模态¶

文档问答¶