2025-03-27 06:00 はてなブックマーク テクノロジー 人気エントリー

タイトル ブックマーク数

国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) – Qiita
222
たとえば、ノド元分割(広げた本の画像を中央で分割する)や傾き補正が必要ないなら、相当するプロセス番号0,1をスキップして、レイアウト抽出(プロセス番号:2)、文字認識(プロセス番号:3)だけを実行するよう指定することができます。一番簡単なのは、上で画像用にマウントしたWindowsのフォルダに保存する方法で、そうすればDockerで推論を開始する時に、以下のように指定できます。

マイナンバーのシステム開発の現場 2019~2020(ザード@) – カクヨム
313
もっと見る。

セブン、専用マシンで作る「紅茶」を全国展開
126

そのエンジニアリングで、製造業を変えてほしい
110
私たちは、エンタープライズ企業の要求に応えられるシステム柔軟性の追加や、リアルタイムデータのさらなる収集や精度の向上、そしてグローバル展開に伴う多拠点での情報連携の強化といった、エンジニアリングにおけるたくさんの課題に直面し、もがきながらも前に進んでいる途中です。

ベクトル検索システムの気持ち
55
2025.03.25 SpeakerDeck Copyright © 2025 Speaker Deck, LLC. All slide content and descriptions are owned by their creators.。

ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox) | テクノエッジ TechnoEdge
176
・【飛ぶ教室】松尾公也さん(Webメディア記者・AIクリエイター) ところで、ChatGPT 4oの画像生成はプロンプトによるインタラクティブな指令を参照画像に対して与えられるので、1枚の写真から三面図を生成することもできます。

食器洗い機がクラウド接続必須なことに怒りを表明した「IoT機器はまずローカル、次にクラウド」というブログが話題に
364

Kubernetesで実現できるPlatform Engineering の現在地
25

MCPサーバーを利用することはセキュリティ的に安全か?
15
Google Chromeが拡張機能の chrome ウェブストア を公開しているのと同様に、MCPを作成したAnthropicは、GitHub (https://github.com/modelcontextprotocol/servers) でMCPサーバーリポジトリを管理しています。

GitHub Copilot を「せんぱい!」と慕ってくれる後輩ギャルにする
29

画像や動画から主要な3D情報を爆速で自動抽出できる「VGGT」が登場、カメラパラメータ・ポイントマップ・深度マップ・3Dポイントトラックなど
9

Devin入門と最近のアップデートから見るDevinの進化 / Introduction to Devin and the Evolution of Devin as Seen in Recent Update
6

ポイント・オブ・ノーリターン:プログラミング、AGI、アメリカ
427

ZOZOTOWNの推薦システムにおけるA/Bテストの標準化 – ZOZO TECH BLOG
107
これにより、施策者の負担が低い状態で統計的に有意な効果を検出するためのサンプルサイズを算出でき、効率的なA/Bテスト期間見積もりとA/Bテスト期間の短縮を実現しました。しかし、A/Bテスト期間を単に短縮すると、サンプルサイズが減少し、指標にポジティブな効果があった場合でも統計的に有意差を確認できないリスクがあります。

技術選定を未来に繋いで活用していく | ドクセル
23

Javaの新しめの機能を知ったかぶれるようになる話 #kanjava – 日々常々
10
私自身、過去の関ジャバとかJJUGとかのセッションでJavaのソースコードの話やJBSなどの話をしているのを聞いて「そんなものがあるんだ」と知って、実際見てみたところがきっかけだったと思います。 kanjava.connpass.com Java24リリース記念イベントの位置付けではありますが、Java24自体の話はそんなしてないというものになります。

PHPerKaigi 2025 感想
11
次のようなフレーズが印象に残った: 機能提供の停止まですることを「葬り」と呼んでいる 期限がないなら⾃分で期限を決めるしかない 「使います?」だと「使います」と回答されてしまいがち 他の人から応援してもらえるかどうかは大切 開発者と運用者双方と対話をする 何れも、明確で能動的な意思を持っていないと出てこない言葉だと思う。

生成AIが変えるプログラミング “ITエンジニアの役割”を考える 未来でソフトウェアを開発するのは誰?
31
これにより、今後のソフトウェア環境は、標準化されたプロダクトと、個別最適化された職人技的なソリューション群、それらを状況に応じて組み合わせるAIエージェントが共存する、重層的な構造へと発展していくでしょう。AIを効率的に使いこなし、その出力を適切に評価・調整できる能力こそが、これからのエンジニアに求められる必須スキルになるのは間違いありません。

大吉祥寺.pm2025を開催します!! – Magnolia Tech
16

大規模視覚言語モデルは人間のように「地図を読み取って最適なルートを見つける」ことができるのか?
21

"「生成AIこんなものか」と諦める前に" 営業AIエージェント開発現場から学ぶLLM品質保証テクニック – Algomatic Tech Blog
10
人間であれば「できるだけ早く返金対応をお願いします」という表現から優先度が高いことや、「商品が届いていない」という表現が技術的な問題ではなく配送の問題を示していることを直感的に判断できますが、LLMがこれらの判断ポイントを正確に処理できているかを確認することが重要です。

NVIDIAがローカルGPUで動作するゲーミングAI「Project G-Assist」をリリース
19

テスラ試乗した時にディーラーさんが『試乗の同乗って結構怖いんですよね…』と話していてなんとなく客層を察してしまった
6

「AIがやりました」 便利すぎるエージェント丸投げが危うい理由
96
代表的な例としては、アンソロピック(Anthropic)の「クロード(Claude)」システムが画面上でユーザーのコンピューターを直接操作することを可能にする「コンピューター・ユース(Computer Use)」や、オンラインツールを利用して顧客の開拓や旅行の計画といったさまざまなタスクを処理できる汎用AIエージェント「マヌス(Manus)」などがある。

サイバーエージェント子会社で“不適切な会計処理”判明 社内調査へ
6
「株主、投資家の皆さまをはじめ、取引先および関係者の皆さまに多大なるご迷惑とご心配をお掛けしますことを深くおわび申し上げます」(同社) CyberOwlは、塾情報サービス「Ameba塾探し」などのメディア事業を手掛ける会社で、2012年に設立。

ADRで意思決定し、そのADRを破棄して新しくADRを作成する実例を紹介します – GraphQLクライアントのキャッシュアルゴリズム変更編 – ROUTE06 Tech Blog
14
api/001-GraphQLの採用(別の ADR へのリンク) で GraphQL の採用を決定したため、フロントエンドで利用する GraphQL クライアントを選定したい。

いまさら聞けない生成AI入門: 「生成AIを高速キャッチアップ」
11

セマンティックレイヤー入門
24
SpeakerDeck Copyright © 2025 Speaker Deck, LLC. All slide content and descriptions are owned by their creators.。Findy「ABEMAの事例とともに学ぶ!セマンティックレイヤーで変わるデータエンジニアリングの世界」イベントの登壇資料です。

noteみたいなサイトってもしかして意外と少ないの?
21

わずか25ドルのPoEインジェクター「Raspberry Pi PoE+ Injector」をRaspberry Pi開発チームが発表、LANケーブル経由の電源供給を安価に実現
29

ChatGPT、実在人物の写真生成など画像生成機能強化
27

LUUP、通信障害で朝からサービス停止–原因はSORACOMか
4

GoogleがAIで治療薬開発を改善する「TxGemma」をオープンモデルでリリース、誰でも利用可能に
6

各所に分散しがちなRubyのバージョンを上手に管理する / use-dot-ruby-version
19
SpeakerDeck Copyright © 2025 Speaker Deck, LLC. All slide content and descriptions are owned by their creators.。社内LT会で発表した資料。

ロリポップ!固定IPアクセス|どこからでも使える固定IPアドレス
23

VSCodeの一部拡張機能にファイルを暗号化して身代金を要求する悪意のある機能が仕込まれていたことが明らかに
7

1152円と1時間でブログアプリをデプロイできる
5
https://github.com/nekoallergy22/nextjs-blog-app/blob/main/.clinerules 本ルールを作成するにあたって、下記の clinerules を参考にしました。特にプロンプトキャッシュの読み取り料金が最も高額(USD 4.74)であり、多くのリクエストでキャッシュされたプロンプトが再利用されていることを示しています。

Facebook(Meta社)の広告枠があまりにもクソすぎる件 / ひさびさにここまでひどい詐欺広告を見た気がする
12
▼こちらもどうぞ
【乗っ取り】変な広告押したらスパイウェア感染と警告 → コールセンターに電話したら、さらにヤバい展開に…(詐欺師の肉声動画あり)ネット犯罪の基本、それが「乗っ取り」である。

DHHが考えるRailsのバリデーション設計
53
最近DHHがonce.comでのCampfireをはじめとしたプロダクトで、NULL制約やDB制約で防げるようなRailsのモデルのバリデーションを積極的には利用しないでいるという主張をしている。

ChatGPTに高精度な画像生成機能「4o Image Generation」が追加される、GPT-4oの知識を活用しつつ画像を生成可能で著名人を含む画像も可
33

board誕生の経緯〜請求書サービスでも販売管理ソフトでもない何か:小さな会社のSaaSの育て方(第1回) – ヴェルク – IT起業の記録
10
2013年当時、見積書や請求書を単体で作成できる「請求書サービス」は存在していましたが、受発注管理や売上の見込みを把握できるような、小規模企業の経営者向けのサービスはほぼなかったように思います。 もともと私は従来型の販売管理ソフトを使ったことがなく、また、起業当時の2011年ごろは「請求書サービス」というジャンルの存在すら知りませんでした(もしかしたらまだなかった?)。

スマホをAndroidに変えたら、LINEのいつもの「アレ」ができなくて絶望した
5
今や多くのiPhoneユーザーが、LINEでメッセージが届くと、「まずは既読をつけずに中身を確認」が当たり前のフローになっているんじゃないでしょうか。 これがあることで、忙しい時、気後れする時、既読をつける心理的ハードルがグッと上がる。 久々にこの機能がない環境を体験すると、メッセージの内容を読みたいけど読めない状況がもどかしいこともどかしいこと。

HTMLは非常にシンプル! 圧倒的な速さでMaterial Design 3のUIを実装できるCSSの超軽量フレームワーク -Beer CSS
72

政府高官が軍事計画の情報共有に使っていたメッセージアプリ「Signal」の脆弱性について政府が職員に警告していたことが判明
12

Ruffに搭載される新しい型チェッカーRed-knotについて
11
https://github.com/astral-sh/ruff/discussions/15149#discussioncomment-11670666 ジェネリクスやオーバーロードなどがまだ実装されていないため、コレクションや四則演算など基本的な部分が動かないというところもあるのですが、拙速に機能を足していくのではなく初めから最良の設計で型チェッカーを構築しようという意思が感じられます。

政府機関でも適切なチームと文化があれば大規模な産業技術を構築できることを示した「リッコーヴァーの教訓」とは?
10

Googleが次世代推論AIモデル「Gemini 2.5」発表、推論とコーディング性能が大きく向上
7

php-fpm がリクエスト処理する仕組みを追う / Tracing-How-php-fpm-Handles-Requests
46
2025-03-23 PHPerKaigi 2025 SpeakerDeck Copyright © 2025 Speaker Deck, LLC. All slide content and descriptions are owned by their creators.。

m3.com iOSアプリにホーム画面とロック画面のウィジェットを導入しました – エムスリーテックブログ
12

エムスリーのiOSアプリでは初の導入ということもあり、ウィジェット実装に関する知見が得られたので共有いたします! m3.comアプリは医療従事者向けのプラットフォームで、最新の医療情報を収集できるアプリです。


財布を気にしたくないのでローカルLLM(Gemma3)にコードを書かせてみた – MNTSQ Techブログ
170
一方で、gemma-3-12b-itが動作するよう設定を変更した場合は正しく動作し、Fizz Buzzプログラムを正しく生成することはできましたが、実用的とはいいがたい出力速度でした。
ここまで設定すると、利用可能なモデルが表示されるので gemma-3-4b-itを選択します。 Clineの画面抜粋 Clineの設定画面が表示されるので、LM Studioに接続するように設定します。

【いまさらやるPostfix】GmailにPostfix+Rspamd(SPF/DKIM)を使ってメールを送る – LIVESENSE ENGINEER BLOG
52

コメント

タイトルとURLをコピーしました