テキストマイニングは、テキストデータから有用な情報を抽出し、分析するためのプロセス。通常、大量のテキストデータをコンピュータープログラムを使用して処理し、パターン、トレンド、洞察を発見するのに使用される。
大量のPDFから有用なものを抽出する作業をしているのだけど、なかなかたいへん。
ひたすら読んで、要約している(ChatGPTにさせている)けど、疲れて嫌になってしまうと、機械学習、デープラーニングなんて言葉をチラ見して、ドライバー、ソフトを入れて遊んでいる。なんとなくドライバーを入れていると、解像度が低く小さくなったりして、苦労している。
このPC、旧い機種だけど、一応、ワークステーションなんで、コンピューティング専用にGPUが独立しているけど、コマンドラインでPythonなんて…
ファイル操作もままならないのにハードルが高すぎ。あすにでも、PDFからそのままテキストを要約することを試してみるけど、どうなることやら…