コンテンツ以外にも、コンピューター上で作成したり表示したりするファイルには情報が含まれています。 メタデータと呼ばれるものです。この記事では、Ubuntuでメタデータを表示および編集する方法を説明します。
メタデータの機能は ファイルを説明、整理し、コンテキストを与えることで、理解、検索、分類、分析が容易になります。
メタデータは何のためにあるのでしょうか?
メタデータの機能
- 検索: ファイル エクスプローラーはメタデータを使用して、アルファベット順、ファイルの種類、作成日または変更日に従ってファイルを表示します。
- 組織: メタデータは大量の情報の整理を容易にします。
- 理解: 人工知能モデル、検索エンジン、ライブラリなどの自動化システムがコンテンツをよりよく理解するのに役立ちます。
メタデータの種類
これらは 3 つのクラスに分類できます。
- 説明: タイトル、作成者、説明、キーワードなど、ドキュメントを識別するデータ。
- 構造: ドキュメントの構造: タイトル、サブタイトル、章、形式。
- 管理: 権限、作成日、サイズ、形式。
Ubuntuでメタデータを表示および編集する方法
メタデータを編集するためのグラフィカル ツールはいくつかありますが、この記事ではターミナルを使用するツールにのみ焦点を当てます。
PDF ドキュメントの形式は次のとおりです。
- 資格。
- 著者。
- テーマ。
- キーワード。
- 作成日
- 変更日。
- 発電機エンジン。
- 作成に使用したソフトウェア。
- 保護と許可。
この情報も含まれる XMP と呼ばれる別の形式もあります。
- 著作権情報。
- サムネイル。
- ドキュメント言語。
- カスタム ラベル。
Ubuntu でメタデータを表示するための便利なコマンドが 2 つあります。
PDF情報
一緒にインストール:
sudo apt install poppler-utils
使用します。
pdfinfo nombre_archivo.pdf
エクシフツール
このツールを使用すると、メタデータを XMP 形式で表示できます。
一緒にインストール:
sudo apt install libimage-exiftool-perl
使用
exiftool nombre_archivo.pdf
メタデータを編集するには、次のコマンドを使用します。
exiftool -parámetro "nuevo contenido del parámetro"nombre _archivo.pdf
この例では、タイトルを翻訳したい場合:
exiftool -Title="Introducción a la programación en Python" Introduction_to_Python_Programming_-_WEB.pdf
すべてのメタデータを削除するには、次のコマンドを使用します。
exiftool -all= nombre_archivo.pdf
削除したことを後悔した場合に備えて、コマンドは PDF ファイルのコピーを作成し、名前に「オリジナル」という説明を追加します。
Docx
Word のネイティブ フォーマットには、ドキュメント メタデータとアプリケーション メタデータが含まれます。
ドキュメントのメタデータには次のものが含まれます。
- 資格。
- 著者。
- 最後に変更した人。
- リビジョンの数。
- 作成日。
- 最終更新日.T
- テーマ。
- キーワード。
- カテゴリー。
- カテゴリー
- ステータス(ドラフト、最終版)。
アプリケーションメタデータ
- テンプレート
- 使用したソフトウェア。
- 総ページ数。
- 単語数。
- 文字数。
- 行数。
- 段落数。
- スケーリング設定。
- 組織。
- チームリーダーの名前。
エクシフツール
コマンド エクシフツール Word 文書のメタデータを表示するためにも使用できます。
使用
exiftool nombre_archivo.docx
メタデータを表示する別の方法は、ファイル拡張子をzip形式に変更することです。セキュリティ上の理由から、コピーを使用してこの操作を行います。
cp nombre_archivo.docx copia_archivo.zip
ファイルを解凍し、必要なフォルダを開きます
unzip copia_archivo.zip -d docxinfo
ファイルからデータを読み取ります
cat docxinfo/docProps/core.xml
ドキュメントのメタデータ
cat docxinfo/docProps/apdp.xml
アプリケーションメタデータの場合
cat docxinfo/docProps/app.xml
どちらも使用 exiftool メタデータは手動で編集できます。繰り返しになりますが、exiftool を使った手順は PDF の場合と同じです。
exiftool -parámetro "nombre_del_parámetro" nombre_del_archivo.docx
同じことを次のように手動で実行できます。
バックアップを作成します
cp nombre_archivo.docx copia_archivo.zip
それをmetadataというフォルダに解凍しました。
unzip copia_archivo.zip -d metadatos
フォルダに行きましょう
cd metadatos
エディターを開きます
ドキュメントメタデータ用
nano docProps/core.xml
nano docProps/apdp.xml アプリケーションメタデータ用
ファイルをdocxとして再パッケージ化します
zip -r ../nombre_archivo2.docx *
このコマンドはディレクトリの外部に新しいドキュメントを作成します。 メタデータ.