管理人のひとことの件

GinSanaさん  
SC ブロンズマイスター
(No.1)
管理人のひとことの件

>2021.10.13  有志のボランティアの方で午後問題のコンテンツ化に協力して入れる方、いらっしゃいませんかね?
>まずは、午後問題PDFを問ごとに分解して簡単に印刷できるようにするところから始めたいです。

協力しますよ。
昔支援士の印刷がダルいと思ったときにqpdf(WindowsもUnix/GNU Linuxもできる)でできましたよ。
--decryptオプションで一度保護を解除しないと切り離しとかができなかったから一手間はかかりますけど、
qpdf ${file} --pages . 1-5 
とか
qpdf split
とか
qpdf  分割
でググるとわかりやすいです。

文字起こしはpopplerとtesseractでたぶんできると思いますがスキャンのdpiとかを確認しないと精度がよくならないのでまだ試してません(そのあたりのスクリプトはGinSanaduki/TB3DSとかをググるとでてきます)。

2021.10.24 19:04
GinSanaさん  
SC ブロンズマイスター
(No.2)
IPAからダウンロードしてファイル分割をするスクリプトをおいておきました。
zipでreleaseから落とすと21年春から令和3年秋まで分割されたpdfが同梱してあります。
github.com/GinSanaduki/IPA_SplitPrint
で検索してみてください(上げたばかりなので、まだgoogleではひっかからないかも)
2021.10.24 22:57
管理人 
(No.3)
ご協力に感謝いたします!
早速分割されたPDFファイルをダウンロードさせていただきました。

こちらでサーバにアップして、まずは各年度の目次ページから各問題のPDFを参照できる形にしたいと思います。とりあえず令和元年秋期のページだけ午後問題PDFへのリンクを設置してみました。

https://www.sc-siken.com/kakomon/01_aki/#pm1

このスクリプトって、各問題の始点と終点を手動で用意する感じですよね。結構な手間だったでしょう..。ありがとうございます。
私としてはWebサービスを使って分割しようと思っていたので、スクリプトでできるとは思ってもいなかったです。
2021.10.25 12:13
GinSanaさん  
SC ブロンズマイスター
(No.4)
>このスクリプトって、各問題の始点と終点を手動で用意する感じ
そうですね。問題の間にメモページがあったりするのでいちいち見ました・・・。テキストが埋め込まれていれば楽なんですがねえ。
2021.10.25 12:31
管理人 
(No.5)
全年度で午後問題PDFへのリンクを設置しました。
これで午後問題を印刷して学習するときの手間が軽減されると思います。

OCRによる文字起こしは結構大変だと思います。AdobeAcrobatとかGoogleドキュメントでもできるのですが、PDFの画質が良くないので日本語の誤判別が多い印象です。
2021.10.25 12:47

返信投稿用フォーム

スパム防止のためにスレッド作成日から30日経過したスレッドへの書込みはできません。

その他のスレッド


Pagetop