- 概要
- Document Processing Contracts
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding Process - Studio のテンプレート
- Document Understanding アクティビティ
- IntelligentOCR
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
キーワード ベースの分類器
UiPath.IntelligentOCR.Activities.DocumentClassification.KeywordBasedClassifier
このアクティビティの機能は次のとおりです。
- キーワードベースのドキュメント分類アルゴリズムを組み込み、繰り返し可能なタイトルを持つファイルの分類をターゲットにします。
- [ドキュメント分類スコープ] アクティビティの内部で使用されている場合、指定されたファイルにある、指定されたトレーニングセットに基づいてドキュメントを分類します。
このアクティビティは、[ドキュメント分類スコープ] アクティビティと [分類器トレーニング スコープ] アクティビティと併用する場合のみ使用できます。
共通
- 表示名 - アクティビティの表示名です。
入力
- LearningData - シリアル化された分類器のデータを含む文字列です。このフィールドは、文字列と String 型変数のみをサポートします。
-
ラーニング ファイルのパス - 分類器データを含むファイルへのフル パスです。このフィールドは、文字列と String 型変数のみをサポートします。
注:一度に設定できるのは、上記のパラメーターのうち 1 つだけです。[ラーニング データ] 文字列または [ラーニング ファイルのパス] 文字列のいずれかを使用できます。
[ラーニング ファイルのパス] は分類器データを取得する場所から場所を指定します。
[ラーニング データ] は、その分類器の実際の情報が含まれています。
その他
-
プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
注: ベスト プラクティスは、その場所に空の.json
ファイルを作成し、その名前を [ラーニング ファイルのパス] フィールドに使用することです。
キーワード ベースの分類器は、設計時にアクティビティの 学習を管理ウィザードにアクセスするだけで設定できます。このウィザードは、ドキュメント分類トレーニング フェーズで収集されたデータをレビューする際にも使用できます。それには、更新されたラーニング ファイルのパスでウィザードを開きます。
このウィザードを使用すると、このアクティビティでドキュメントの種類を識別するために使用されるキーワードを設定および管理できます。ファイル パスを編集する必要性に合わせて作成されました。代わりに変数付きの学習データ パラメーターが使用される場合、特定のファイル パスを編集するか、この操作を中止するかを確認されます。
- [キーワード ベースの分類器]/[キーワード ベースの分類器トレーナー] アクティビティをワークフローに追加します。
-
.json
ファイルのパスを追加して、[キーワード ベースの分類器] アクティビティを構成します。- パスが指定されておらず、[学習の管理] オプションがクリックされると、学習ファイルのパスの入力を確認するポップアップが表示されます。パスが指定されると、ウィザードが開きます。
.json
ファイルではなく変数を追加できますが、ウィザードが LearningData 変数に学習パターンを適用することはできないため、編集できる特定のファイルのパスを要求します。
-
[学習を管理] オプションをクリックします。
-
[ウィザード] ウィンドウが開きます。
-
-
パスが指定されておらず、[学習の管理] オプションがクリックされると、学習ファイルのパスを確認するポップアップが表示されます。パスが指定されると、ウィザードが開きます。
注:.json
ファイルが使用できない場合でも、新しい.json
ファイルの名前をアクティビティに直接追加することができ、.json
ファイルが、指定されたフォルダー内に自動的に作成されます。
ウィザードには、タクソノミーで定義した数のドキュメントの種類カテゴリがあります。ドキュメントの種類ごとに 1 つまたは複数のキーワードを追加できます。このアクティビティは特定のドキュメントのキーワードを学習し、後でこれらのルールに基づいて特定の種類のドキュメントを識別および分類することができます。
""
(引用符) で囲まれた文字列として入力する必要があり、単一または複数の値を追加できます。
- [新しいキーワード セットを追加] ボタンをクリックすると、そのカテゴリに余分なフィールドを追加します。
- ボタンをクリックすると、フィールドとそのキーワードが削除されます。
-
ウィザードの設定を保存するには、[保存] ボタンをクリックします。追加されたすべての値は、プロジェクトの
.json
ファイルにあります。注: キーワードを管理 ウィザードのキーワードの一部として入力された二重引用符は、C# フレーバーのプロジェクトであっても、Visual Basic の規則 (二重二重引用符) に従い常にエスケープされます。
Document Understanding との連携
[キーワード ベースの分類器] アクティビティは、Document Understanding のソリューションに含まれます。詳細については、『Document Understanding ガイド』をご覧ください。