著者:石岡 智明
ページ数:24
¥150 → ¥0
この本はPythonを使ってオフィス文書(Word・PDF・CSVファイル)を扱うためのリファレンスで、「Pythonドキュメント・ハンドリング・リファレンス」の分冊版です。 テキストファイル、Excelファイルを扱う事をご希望の場合は他の分冊版「テキストファイル編」「Excelファイル編」または、統合版をご利用ください。
本書はリファレンス本ですので説明、解説やサンプルスクリプトは最小限となっています。 詳細解説は他の書籍やネットの情報を参照してください。
対象読者はオフィスでの仕事を自動化しようと考える一般事務仕事をされている方です。 プログラマー等のIT系のお仕事をされている方ではありません。 Pythonの基本に関しては他の多くの書籍やネット上の情報が豊富ですのでそちらを参照していただければこの本の内容はすぐに理解できます。 この本の内容自体もドキュメント・ハンドリングの基本的なものとなっていて難しいものではありません。
詳細な解説とサンプルスクリプトがご希望の方には下記の書籍を推薦いたします。
「退屈なことはPythonにやらせよう」Al Sweigart 著 相川 愛三 訳 オライリー・ジャパン
※上記では日本語の扱いに関する部分が不足しておりますが、本書では日本語での処理も網羅しています。
※また基本的な落し穴を避けてツールを使用できるように注意して記述しています。
※長いサンプルスクリプトでなくターミナルで簡単に確認できるようにし要点が分かり易いようにしています。
※Windows10上で使用する事を想定しています。
※Python3系を想定しています。
Wordドキュメントの扱い方
1) Word文書の基本構造について
2) 文書の読み込み docx.Document(ファイル名)
3) paragraphの扱い paragraphs[ ]
4) Runの扱い runs[ ]
5) ファイルの全テキストを抽出
6) Word文書の新規作成 docx.Document() → save(ファイル名)
7) 文のの追加 add_paragraph、add_run
8) 分や文字の入れ替え
9) 文や文字の削除
10) 各要素の追加
PDF文書の扱い方
1) 英語のPDFファイルからテキストを抽出
2) 日本語のPDFファイルからテキストを抽出
3) PDFファイルの統合
CSVファイルの扱い方
1) CSVファイルの扱いの手順
2) 値をリストに保存する reader(ファイルobj.)→list(リーダーobj.)
3) Readerオブジェクトの値を操作
4) CSVファイルへの書き込み
シリーズ一覧
この期間中は料金が980円→0円となるため、この記事で紹介している電子書籍は、すべてこのKindle Unlimited無料体験で読むことが可能です。