pythonを使ってDynamoDBの複数テーブルから非同期でデータ取得してみる

Python AWS

こんにちは。たかぱい（@takapy0210）です。 DynamoDBの複数テーブルからなるべく高速にデータを取得するために、非同期でデータ取得することはできるのか？を少し調べてみたのですが、あまり事例が無かったのでメモ程度に残しておきます。ユースケースとし…

#Python #AWS #DynamoDB

2024-01-04

DataformをGoogle Cloud上から触ってみる（rawデータから集計テーブルを作るまで）

BigQuery GCP

たかぱい（@takapy0210）です。正月にGoogle CloudのDataformをゴニョゴニョ触っていたので、その備忘録を残しておこうと思います。 Dataformとは dbtとの違いは...？使用したデータ実際に動かしてみる基本的な設定を記載する「dataform.json」 Dataform…

#GCP #Dataform #データマネジメント

2023-12-17

予期的UXという概念がとてもしっくりきた話

みなさんこんにちは。たかぱい（@takapy0210）です。最近、UX白書*1で述べられている「予期的UX」という言葉を知り「まさにこのUXを上げるために試行錯誤してるんだよな〜」と、しっくりきたので、まだ完全に理解したフェーズ*2ではありますが、ここに今感…

2023-07-31

FastAPIで特定エンドポイント（Path）のログを出力しない方法

Python Python-Webアプリ

最近FastAPIに触る機会があり、ログ周りで少し躓いたので備忘録として残しておきます。背景補足特定エンドポイントのログをフィルタリングする方法おまけ Uvicornのログをjson形式で出力する方法エンドポイント毎のレスポンスタイムを計測する方法背景…

#Python #FastAPI #logging

2022-12-19

2022年の振り返り

Others

みなさんこんにちは。たかぱい（@takapy0210）です。年末も近づいてきましたので、久しぶりに今年の振り返りでもしていこうと思います。この記事はコネヒト Advent Calendarのカレンダー 17日目の記事です。お仕事オンボーディング改善 A/Bテストの標準…

2022-03-22

Luigiを使って機械学習パイプラインを構築する3つのメリット

Python MLOps Python-機械学習

みなさんこんにちは。たかぱい（@takapy0210）です。本エントリでは、（今更ながら）Luigiを使ってみて感じたメリットをつらつら書いています。最後にはTitanicのコードを使って実際の機械学習パイプラインを構築してみた例も載せているので、よければ参考…

#python #機械学習パイプライン #luigi

2021-12-19

M1 Macのdocker環境にテクニカル指標計算ライブラリ「TA-Lib」をインストールする方法

みなさんこんにちは。たかぱい（@takapy0210）です本日はM1 Macの分析コンテナ環境に株価分析ライブラリのTA-Lib*1をインストールする際に結構苦労したので、その備忘です。 Dockerfileの内容とエラー内容こちらのサイト*2などを参考に以下のようなDockerf…

2021-12-11

TensorFlow × HuggingFace Transformers（TFBertModel）を用いたモデルの保存時に発生するエラーの回避方法

Python Python-機械学習-自然言語処理

みなさんこんにちは。たかぱい（@takapy0210）です。本日はTensorFlow×Transformers周りでエラーに遭遇した内容とそのWAです。環境実装内容エラー内容エラーの原因ワークアラウンドなんでこれで解消できるのか？モデルの保存方法参考環境実行環境…

#python #TensorFlow #huggingface

2021-08-17

Google ColabとVSCodeを用いた分析環境運用方法〜kaggle Tipsを添えて〜

Python Python-機械学習 Python-機械学習-kaggle MLOps

こんにちは。takapy（@takapy0210）です。本エントリは下記イベントでLTした内容の元に、補足事項やコードスニペットなどをまとめたものになります。 kaggle-friends.connpass.com ちなみに今回LTしようと思ったきっかけは以下のような出来事からだったので…

#Colab #colaboratory #Kaggle #機械学習 #Python #VSCode

2021-08-10

PandasからBigQueryにデータを保存する際に「Resources exceeded during query execution: UDF out of memory. ..... columns is too large」エラーが出た時の対処方法

Python GCP BigQuery

こんにちは。takapy（@takapy0210）です。表題の件で少し困ったので、備忘がてら記事に残しておこうと思います。やろうとしていたことエラー内容該当箇所のコード work around 最後にやろうとしていたこと BigQueryのPython SDKを用いて、Pandasで読み…

#BigQuery #Python #pandas

2021-07-03

【言語処理100本ノック 2020】 8章をPythonで解いた（TensorFlowを使用）

Python Python-機械学習 Python-機械学習-自然言語処理 Python-機械学習-自然言語処理-言語処理100本ノック 2020

こんにちは。takapy（@takapy0210）です。本エントリは言語処理100本ノック2020の8章を解いてみたので、それの備忘です。簡単な解説をつけながら紹介していきます。ネット上に掲載されている解答例はPytorchによる解法が多かったので、TensorFlowを用いて…

#Python #NLP #言語処理100本ノック

2021-06-20

【言語処理100本ノック 2020】 7章をPythonで解いた

Python Python-機械学習 Python-機械学習-自然言語処理 Python-機械学習-自然言語処理-言語処理100本ノック 2020

こんにちは。takapy（@takapy0210）です。本エントリは言語処理100本ノック2020の7章を解いてみたので、それの備忘です。簡単な解説をつけながら紹介していきます。 nlp100.github.io コードはGithubに置いてあります。 github.com 第7章: 機械学習単語の…

#NLP #Python #言語処理100本ノック

2021-06-06