AI
[Dev Note] Gemini 3 …
前言:Gemini 3 世代下的 PDF 黑魔法
做為一個熱愛在 Side Project 裡串接 AI 的開發者,過去這半年,我跟 Google Gemini 的關係大概就像坐雲霄飛車一樣:從熱戀、到失望分手(轉向手刻輪子),再到今天——我又重新愛上它了。
今天想跟大家聊聊 Gemini 3 在 PDF 文件處理 (Document Processing) 上的一個「無聲但巨大」的改動。如果你跟我一樣,過去曾經因為 GEMINI 的 file api ,總是把 PDF 轉圖片導致 Token 爆炸而去尋找其他解決方案(to markdown、OCR、vision model),那我得說, …
Gemini vs Grok 競爭分析:一場關於生 …
在 2025 年的科技投資版圖中,最引人注目的對決莫過於 Google 的 Gemini 與 xAI 的 Grok。這不僅僅是兩個大型語言模型(LLM)的技術較量,更是兩種截然不同的商業模式與資本邏輯的碰撞。
隨著 xAI 的估值在近期融資談判中逼近 2,300 億美元,以及 Alphabet (Google 母公司) 將年度資本支出 (Capex) 推升至 900 億美元以上,這場「AI 軍備競賽」已經進入了白熱化的深水區。本文將從投資與產業分析的角度,拆解這兩大巨頭的競爭優勢與護城河。
1. 資本支出的規模與效率:TPU vs GPU 的算力之戰
首先,我們必須關注「算力」這個 AI 時代 …
[教學] Cloudflare Auto Rag …
前言:AI + LLM = 第二大腦?
前幾天在 FB 社團上意外看到有篇貼文是在講述說 AI + LLM 可以化作為第二大腦。
印象中作者的例子是將 Obsidian(筆記軟體)搭配 LLM 的套件做整合。讓過往的筆記軟體可以真正成為一個大腦,你可以透過和 LLM 對話的方式去探尋自己過往的筆記內容。
聽起來很酷!如果我沒誤會他的意思的話,聽起來很像是把所有筆記作為資料庫,套用 RAG 的機制去實作。
這就很像自己私人的 notebookLM 一樣,當時也只是看過以後就沒特別著墨。反正筆記軟體我已經選用 Anytype 作為我的私人筆記,沒必要為了 讓 AI 知道 我的一些機敏資訊而去研究。 …
[教學] 華爾街日報 AI 自動化摘要,寄發電子信
前言:一個懶惰的想法
約莫今年三月份(2025-03)的事情,和同事閒聊時有談到最近他訂閱了華爾街日報的消息。
並且每日也會寄送報紙版本的華爾街日報到信箱來,但是每日看完一份報紙對於一個上班族工程師來說是個奢侈的妄想,或許對現代人來說都是。
如果能有更簡短的重點資訊和摘要,應該會對日常接收資訊上有所幫助。甚至可以進一步過濾出有用的資訊就更好了。
所以當下決定搞起這份專案。
核心概念很簡單,就是
從下載《華爾街日報》(WSJ) 的每日 PDF 報紙,利用 Google Gemini AI 進行深度分析與摘要,最終將精美的 HTML 格式報告透過 Email 發送給訂閱者。