Open Deep Research 使用分享

在這個資訊爆炸的時代,如何從海量資料中找出真正有價值的見解,已成為一項至關重要的能力。近期,OpenAI 推出了名為 Deep Research 的新功能,它能根據使用者的指令,自動在網路上蒐集、分析並撰寫完整的研究報告。然而,沒過幾天,有人開源了一個類似的專案——open deep research

Open Deep Research

open deep research 這個開源專案由一位名為 Nick 的開發者所創建,他的另一個知名專案 Firecrawl 在 GitHub 上擁有 26K 星,這個工具能夠將網站內容解析為 Markdown 或結構化資料,方便 LLM(大型語言模型)進行分析。看到這大家應該知道為甚麼作者要開發 open deep research 了。

該專案可以在本地運行,亦提供雲端版本,免費用戶可獲得 500 次的使用機會。接下來,我將透過實際操作以及使用 Cursor 的 codebase 功能分析運作原理,以更通俗的方式解析它的運作原理。

Open Deep Research 的核心運作機制

1. 研究狀態管理(researchState)

在開始研究時,系統會建立一個 researchState 物件,它像是一本研究筆記,負責追蹤整個研究過程的關鍵資訊,包括:

  • findings:從網頁中提取的文本與資訊發現。
  • summaries:每次迭代後 AI 產生的摘要。
  • nextSearchTopic & urlToSearch:下一步搜尋的主題與網址,由 AI 根據當前研究結果決定。
  • currentDepth & maxDepth:目前研究的層級與最大深度(預設為 7 層)。
  • 其他如 failedAttempts(搜尋失敗次數)與 completedSteps(已完成的步驟數)等。

2. 即時進度追蹤

整個研究過程會透過資料串流 (dataStream) 即時回傳當前進度,如研究深度與已完成步驟,讓使用者能掌握研究狀況。

3. 研究迴圈:搜尋、提取與分析

該專案的核心是一個迴圈,當 currentDepth 尚未達到 maxDepth 時,系統將不斷執行以下三個階段:

3.1 搜尋階段

  • 設定搜尋主題(最初由使用者提供,後續根據 AI 分析更新)。
  • 執行搜尋(在網路上查找相關資訊)。
  • 若搜尋失敗,系統會記錄錯誤並根據失敗次數決定是否終止研究;成功則會記錄並顯示結果。

3.2 提取階段

  • extractFromUrls:從搜尋結果的前幾個網址提取相關資訊。
  • Firecrawl:負責抽取網頁內容,儲存供後續分析。

3.3 分析階段

  • AI 透過分析並生成以下結果:
    • summary:研究成果的摘要。
    • gaps:當前研究中的知識缺口。
    • nextSteps:下一步應關注的議題。
    • shouldContinue:決定是否繼續研究。
    • nextSearchTopic & urlToSearch:提供下一輪研究的方向。

若 AI 判斷研究已足夠,則終止迴圈;否則,繼續進行下一輪搜尋與分析。

thinking-process
思考過程

4. 最終綜合與報告生成

當研究迴圈結束後(因達到最大深度、搜尋失敗或 AI 判斷研究完成),系統將進入最終整合階段:

  • 資料整合:根據前面所有累積的 findings 與 summaries,透過 LLM 來生成一份完整、深入的研究報告。
  • 報告內容:這份報告通常包含了關鍵見解、結論,甚至會標明仍存在的不確定性,並且引用所有來源,讓使用者可以追蹤資訊來源。

簡易測試:

Prompt:

“請分析特斯拉未來市場版圖,和可能的走向,可以給我多個觀點。”

最終 output:

特斯拉的未來市場版圖和可能的走向可以從多個角度分析:

  1. 市場競爭與挑戰:
    • 特斯拉面臨來自其他汽車製造商如大眾、通用和寶馬的激烈競爭,這些公司正在加速推出電動車型。
    • 政府對電動車補貼政策的調整可能影響消費者的購買決策。
  2. 技術創新與生產效率:
    • 特斯拉在電池技術方面取得重要進展,4680電池單元的生產速度顯著增加,降低了電池成本。
    • Gigacasting技術提高了生產效率並降低了成本。
  3. 市場擴張與全球佈局:
    • 特斯拉在全球新能源車市場中占據較高市場份額,並在中國、歐洲和北美建立了Gigafactories以提高生產能力。
    • 在中國,特斯拉通過設立上海工廠來降低成本並提高市場競爭力。
  4. 未來產品與技術:
    • 特斯拉的RoboTaxi Cybercab預計在2026年投產,但目前尚不合法上路。
    • Optimus機器人的量產成本為2-3萬美元,但智能化水平仍需提升。
  5. 政策支持與市場信心:
    • 美國政府對新能源車的支持政策不斷加碼,包括稅收減免和補貼政策。
    • 市場對特斯拉的長期成長性持樂觀態度,尤其是在新能源車市場的持續擴張中。
  6. 股市表現與投資者信心:
    • 特斯拉股價在盤中一度上漲超過22%,反映了市場對其未來發展的強烈信心。
    • 然而,特斯拉的市盈率較高,預示著未來可能出現波動。

這些觀點顯示,特斯拉在技術創新和市場擴張方面具有優勢,但也面臨市場競爭和政策變化的挑戰。未來的市場走向將取決於其在技術、政策和市場需求方面的適應能力。

資源消耗:

  • 時間:3分鐘左右
  • 金錢: 0.00696+0.00488+0.00154+0.00151+0.00123+0.00118+0.00116+0.000414+0.000144 = 0.019018(美金) 大約是 0.6 台幣。
cost
OpenRouter 上顯示的費用和 token 數量

總結:

  1. 整體效果普通,未達預期,可能與 Prompt 設定有關。
  2. 測試其他主題時,結果依舊普通,或需更深入調整與驗證。
  3. OpenAI Deep Research 整體表現仍明顯優於 open deep research(看別人的分享文)。
  4. 成本極低,適合低成本實驗用途。

未來,這類 AI 研究工具將持續進化,讓我們能更快速地找到關鍵資訊,從數據中發掘更有價值的見解。

分享出去