どこにでもいるSEの備忘録

たぶん動くと思うからリリースしようぜ

ty (Red-Knot) を使ってみる

Python

ついこの間ですが、AstralからType Checkerであるtyが公開されました。

Xで話題にしている方も結構多かったので興味が湧いたので、実際に使ってみたので今回はそのメモです。

続きを読む

コサイン類似度のいろんな書き方

Python

前にこんなことやってました。

www.nogawanogawa.work

コサイン類似度の計算を高速化したくなることがちょくちょくあるのですが、「ぶっちゃけどれくらいのスループットが出せるもんなの？」というのが気になったので完全に興味本位でやってみます。

続きを読む

"ローカルで"LLM sherpaを使ったPDFの視覚的構造解析をする

Python

この前こんなんをやってました。

www.nogawanogawa.work

この中でLLM sherpaを使用していましたが、こちらのgithubをよく読んでみると解析部分もOSSになってることが分かりました。つまり、視覚的構造解析が完全にローカル環境で実装できるということになります。

せっかくやりかけたので、ローカル環境でやってみたので今回はそのメモです。

続きを読む

PDFの構造解析をする"LlamaParse"と"LLM Sherpa"を使ってみる

Python 備忘録

ChatGPTに作ってもらったヘッダー画像です

ちょっと長いテキストデータだと、テキスト自体が章や節のような構造を持っていたりします。人間はこうした文章内部の構造は読めばなんとなく理解することができますが、自動でこれをやるのはちょっと難しかったりします。

こういった処理を行なうツールがないかと探していたところ、"LlamaParse"と"LLM Sherpa"というライブラリを見つけました。どちらもそこまで長いコードではなく、OSSとはいえ自分でも読めそうなくらいでした。ということで、パッとこれらのコード読んでみてどんな感じの処理を行っているのかなぞってみたので、そのメモです。

ランキング参加中

プログラミング

ランキング参加中

続きを読む

Pythonでいろんなサーバーを立ててみる

Python

「こんな感じのAPIサーバー立てといて」なんて言葉、開発してれば日常茶飯事です。そんな「APIサーバーを立てる」と言ってもいろんな種類がありますね。

今回はよくあるAPIサーバーを一通りPythonで立てるだけ立ててみようと思います。

ランキング参加中

ランキング参加中

プログラミング

続きを読む

Numpyでcos類似度の計算を高速化する

Python

ただの小ネタです。

個人的にPythonを使っていてcos類似度を計算することがありました。ただ、類似度を計算したいペアの数が多いと結構時間がかかってしまっていました。

これを高速化するにはどうしたらよいか、いろいろ調べて試してみたのでそのメモです。

続きを読む

（小ネタ）pandarallelを使ってpandasのapplyを高速化する

Python

pandasのapplyの高速化方法として、pandarallelやswifterが良さそうというのをこちらの記事を読んで知りました。

blog.ikedaosushi.com

非常に高速に処理を実行することができて良さそうだったので、使ってみたメモです。

続きを読む

パワーポイントとPDFを自動で画像に変換したい

Python

f:id:nogawanogawa:20210503084049j:plain:w500

ちょっとした技術調査です。

MS Office系のデータとPDFを大量に画像に変換したいことがあったんですが、あまりに量が多くて自動化したくなりました。

「どうせ簡単に出来るやろ」とか余裕ぶっこいてたら実は結構めんどくさかったので、今回はそのやり方をメモとして残しておくものです。

続きを読む

Streamlitを使ってみる

Python

f:id:nogawanogawa:20210127222023p:plain

最近こちらの記事を拝見しました。

tech.jxpress.net

昨年くらいから、Streamlitはちょっとした話題になっており、良い機会だったので使ってみたので、今回はそのメモです。

続きを読む

Djangoについて勉強したメモ

Python

f:id:nogawanogawa:20201229165348p:plain

年末年始なんで、2020年にやり残した事を勉強していこうと思います。今日は、Djangoについて勉強していこうと思います。

事情としては、最近になってDjangoのコードを触ることがあって、その際にどうやって書くのが正解なのか、思想的なものがあんまりよくわからなくなってしまったので、初心に戻ってやり直そうというくらいの気持ちです。

今回参考にさせていただいた書籍はこちらです。

Python Django 3超入門

Python Django 3超入門

作者:掌田津耶乃
発売日: 2020/07/13
メディア: Kindle版

超入門と書いてあるだけあって、初学者にも非常にわかりやすい表現となっていました。 Django・Python初心者にとっては良い書籍だと感じました。

今回は、こちらの書籍を参考に色々弄ってみたので、今回はそのメモです。

続きを読む

Poetryを使ってみたメモ

Python

f:id:nogawanogawa:20201227153840j:plain

年末年始なんで、2020年にやり残した事を勉強していこうと思います。今日は最近だんだん聞くようになってきたPoetryについて勉強していきたいと思います。

続きを読む

Google Analytics APIを使ってブログのPV数を見る

Vue.js Python Google Cloud Platform

f:id:nogawanogawa:20200323213207p:plain

せっかくのGWなんで(?)、今回は普段は絶対やらないことをやってみたいと思います。

今回はGoogle Analytics APIを使ってブログに対するアクセスを可視化してみたいと思います。

こちらの記事を参考にさせていただきました。

それではやっていきたいと思います。

続きを読む

Pythonでクローリング&スクレイピング

Python

世の中はデータで溢れているとは言うものの、一般人がそのままデータ解析に使いやすいファイル・データはなかなか手に入らないものです。

今回は、世の中にあるWebページから、必要なデータを収集して解析できるファイルを作成することを目標に、スクレイピングを勉強してみました。

参考にさせていただいのはこちらの本です。

Pythonクローリング&スクレイピング[増補改訂版] -データ収集・解析のための実践開発ガイド

Pythonクローリング&スクレイピング[増補改訂版] -データ収集・解析のための実践開発ガイド

作者:加藤耕太
発売日: 2019/08/10
メディア: 単行本（ソフトカバー）

今回はその勉強のメモです。

続きを読む

3D CADデータをブラウザで見たかった

JavaScript Vue.js Python Flask

今までブラウザで3Dで何かを表示するときは、３次元のグラフくらいしか使ったことがなく、3Dの形状をブラウザで確認したい際にCADデータをブラウザで表示することをやってみたのでそのメモです。

続きを読む