人工智能概念辨析:介紹大模型相關(guān)術(shù)語(yǔ),回顧大模型從運算推理、知識工程到深度學(xué)習的發(fā)展歷程,對比生成模型和推理模型在定位、推理能力、多模態(tài)支持、應用場(chǎng)景和用戶(hù)交互體驗的差異。
DeepSeek R1
公司與模型:DeepSeek 成立于 2023 年 7 月,獲幻方量化支持,專(zhuān)注大語(yǔ)言模型開(kāi)發(fā)。旗下模型包括生成模型 V3 和推理模型 R1,R1 具有推理能力強、開(kāi)源、低成本、國產(chǎn)化等特點(diǎn),在國際競爭中處于D一梯隊。
使用與部署:提供官方網(wǎng)頁(yè)、APP、API,還可通過(guò)國家超算平臺等第三方渠道使用。個(gè)人可通過(guò) Ollama 部署蒸餾模型,企業(yè)可利用 vLLM 進(jìn)行生產(chǎn)級部署。部署 R1 滿(mǎn)血版需特定算力支持,不同算力配置價(jià)格不同。
模型原理:GPT 采用 Transformer 架構,經(jīng)預訓練、監督微調等階段,基于上下文預測下一個(gè) token。生成模型有語(yǔ)言理解和生成等能力,但存在幻覺(jué)等問(wèn)題。DeepSeek R1 通過(guò)思維鏈、強化學(xué)習和蒸餾技術(shù),提升推理能力,減少模型大小。
落地應用
提示詞技巧:包括真誠直接、使用通用公式、說(shuō)人話(huà)、反向 PUA、善于模仿、擅長(cháng)銳評、激發(fā)深度思考等,可提升對話(huà)質(zhì)量。
應用場(chǎng)景:適用于推理密集型任務(wù)、教育與知識應用、文檔分析、開(kāi)放L域問(wèn)答寫(xiě)作等場(chǎng)景。在教育與學(xué)術(shù)L域,可用于教學(xué)設計、作業(yè)批改、論文輔助等;在知識付費L域,可進(jìn)行課程大綱設計、直播腳本撰寫(xiě)等。
附件:DeepSeek原理與落地應用,基于上下文預測下一個(gè) token,激發(fā)深度思考等,提升對話(huà)質(zhì)量

本地化部署DeepSeek的基本方法,了解更專(zhuān)業(yè)的企業(yè)級部署方法,講解Unsloth R1動(dòng)態(tài)量化部署的三種實(shí) 現路徑:基于llama.cpp、KTransformers以及Ollama框架動(dòng)態(tài)量化部署
美國在 GenAIL域的L先地位正在被中國迎頭趕上,AI 供應鏈格局將被重塑;開(kāi)放權重模型正在推動(dòng)基礎模型層商品化,為應用開(kāi)發(fā)者帶來(lái)新機遇;擴大規模并非通往 AI 進(jìn)步的途徑
突破大模型訓練固定思維,敢于嘗試在低精度 FP8 的模式下訓練大模型,出現了較好的效果,每10年計算成本降低約1000倍,但人們的購買(mǎi)量增加了 10 萬(wàn)倍
DeepSeek大模型的開(kāi)源,低成本和G性能將大幅降低大模型的獲得,部署和應用成本,將加快大模型在 B 端和 C 端應用場(chǎng)景的落地;已應用于端側、教育、金融、辦公、傳媒、醫療、智能汽車(chē)、企業(yè)服務(wù)等多個(gè)應用場(chǎng)景,應用L域廣闊
DeepSeek 降低了單個(gè)模型的部署成本,AI 應用有望大規模落地, 推理算力需求將顯著(zhù)增長(cháng),相關(guān)廠(chǎng)商有望加速進(jìn)入業(yè)績(jì)兌現期,在 AI 應用前沿落地 場(chǎng)景中, AI 應用產(chǎn)業(yè)有望迎來(lái)共振期
PI 調用層面,DS/OpenAI 的輸入費用分別為 0.55/15 美元/百萬(wàn) token,DS 推理使用成本僅為 OpenAI 的 4%,顯著(zhù)的降低資金門(mén)檻,推動(dòng)了 AI 技術(shù)平權
準確數據洞察與自動(dòng)化效能提升方法論;DeepSeek將在企業(yè)服務(wù)、科研創(chuàng )新等垂直L域深度滲透;DeepSeek將通過(guò)開(kāi)源戰略擴大開(kāi)發(fā)者社區規模,并推出模型微調平臺和低代碼部署工具
周鴻祎以DeepSeek帶來(lái)的變革為切入點(diǎn),深入剖析AI行業(yè)發(fā)展趨勢,并分享了AI技術(shù)于創(chuàng )業(yè)的應用前景,未來(lái)應用將從六大方向實(shí)現爆發(fā),企業(yè)內部未來(lái)一定是多個(gè)大模型組合工作
AI生成的回答重復相似,缺乏新意,即使改變提問(wèn),無(wú)法提供不同的結論;使用更多樣的訓練數據和算法,提GAI的多樣性;優(yōu)化訓練參數, 避免模型陷入局部?jì)?yōu)
模型難以處理訓練集外的復雜場(chǎng)景,模型過(guò)度依賴(lài)參數化記憶,普通用戶(hù)難以辨別AI內容的真實(shí)性,可能對醫療建議、法律咨詢(xún)等專(zhuān)業(yè)場(chǎng)景的可 靠性產(chǎn)生長(cháng)期懷疑
DeepSeek技術(shù)突破與應用場(chǎng)景,冷啟動(dòng)數據與多階段優(yōu)化,本地部署與端云協(xié)同,垂直L域深耕(醫療、金融、教育);智能協(xié)作與自動(dòng)化轉型,消費決策與商業(yè)研究賦能
你想要生成什么樣的文案? 這樣的文案具備哪些特征? 你要針對什么生成類(lèi)似文案? 篇幅、用詞、結構優(yōu)化;批量生成新媒體文案