AI大模型讓對話式BI真正落地。
作者|栗子
“我們用AI大模型改造BI的出發點非常簡單,就是希望降低數據分析門檻,讓人人都能成為數據分析師?!狈洰a品研發中心總經理陳敏對「甲子光年」表示。
隨著AI大語言模型技術的快速發展,幾乎各行業企業都在探索AI改造自身業務場景的可能性,“把業務用AI重做一遍”的論調早已成為共識。
在尋找AI落地場景的過程中,BI(商業智能)幾乎是一個不需要討論的確定性答案。
率先交卷的是微軟。
去年6月,微軟宣布將Copilot整合進自己的企業數字化工具“Power BI”,打響了“AI+BI”的第一槍。幾乎同一時間, Tableau(2019年被Salesforce收購)、ThoughtSpot和Sisense等全球知名BI服務商都紛紛宣布在自身產品中注入AI大模型的計劃。
趨勢很快傳入國內。從去年至今,陸續有不少中國BI廠商也都開始推出“ChatBI”、“BI Copilot”等類似功能。
大模型所催生的“對話式BI”之所以能夠快速成為AI落地toB業務的最佳場景,背后的原因其實非常簡單。因為在今天這個數據已成為關鍵生產要素的時代,對話式BI能夠讓用戶通過日常對話輕松獲取數據價值,大幅降低數據應用門檻,解決了數據使用中最核心的問題。
只是,AI與BI的結合過去早已有過嘗試,卻并未激起太大水花。這一次,AI大模型能否真的給BI帶來價值?AI與BI的結合究竟應該用怎樣的姿態?
在這些問題上,帆軟給出了“領先版本”的思考。
1.ChatBI需要被重新定義
“可視化大屏”可能是絕大多數企業業務人員對“傳統BI”的主要印象。
這并不難理解。因為傳統 BI產品起源于上世紀八九十年代,那時候開始陸續出現并逐漸發展成熟的技術包括 SQL、OLAP、數據可視化等,使用門檻極高。所以對于不懂技術的業務人員來說,可視化大屏幾乎是他們接觸BI的唯一場景。
2016年,隨著深度學習、神經網絡等技術的逐步成熟,包括微軟在內的一些公司開始嘗試用AI來改造BI(Gartner定義為“增強BI”)。這種增強BI確實一定程度上降低了使用門檻,也催生了早期的檢索式BI。
不過,這種改造并沒有從本質上改變BI的產品形態,企業依然需要為業務部門配備具有技術能力的數據分析人員,才能夠彌合業務與數據分析之間的鴻溝。
為了進一步降低使用門檻,讓更多的業務人員使用BI,2019年前后,國內外BI廠商開始探索“問答式BI”的可行性。
據帆軟FineChatBI產品負責人翁林君透露,當時帆軟也成立了專項攻堅團隊,并聯合兩家外部合作商共創,嘗試推廣問答式BI產品。
但問題在于,當時的問答式BI產品在技術上大都采用“規則解析”或“神經網絡(?。┱Z言模型加規則解析”的方法來實現文本到SQL的轉化。技術上的限制導致問答的召回和精度不夠理想。
與此同時,利用端到端(Seq2Seq)方法訓練出的模型泛化能力不足,在一個數據集上調好的模型,換到另一個數據集上就不行了。
翁林君告訴「甲子光年」,過去,阻礙用戶使用問答式BI的一個典型例子,就是用戶很難問出“正確的數據問題”。因為這種問題通常需要用戶具備較強的數據思維,同時又具備專業的業務知識。
為了解決小模型的泛化問題,企業就需要針對特定場景不斷增加語料,并重新訓練模型來提高精度和召回,從而導致實施成本變得難以接受。
也就是說,上一代的問答式BI,沒有突破“意圖識別、查詢結果的精度和基于場景定制化開發、部署的成本之間”的“不可能三角”,最終淪為了擺設。所以當時帆軟也隨之暫停了問答式BI的產品推廣。
在帆軟看來,上一代問答式BI本質上是一個“對話式/檢索式”的取數工具,它的價值僅僅是讓業務人員更容易的取到數據。但是,光能取到數據還遠遠不夠。如果業務人員不具備數據分析思維,也沒辦法獨立完成從數據到業務的分析閉環。
而與過去相比,今天的AI大模型已經成為了當下最大技術紅利。在通用場景下,大模型展現出的跨任務、跨場景的泛化能力,讓包括微軟在內的廠商都看到了實現成熟、能落地的“對話式BI”產品的可能性。BI的產品形態也開始進入了一個新的階段。
2.FineChatBI,從業務到數據閉環
經過近兩年的技術投入,如今,帆軟帶著全新的“FineChatBI”重回對話式BI市場。
在帆軟的定位中,FineChatBI是一款“對話式業務分析工具”,而非“數據分析工具”,二者的區別非常大。因為數據分析工具意味著它的最終用戶依舊是企業小部分的數據分析人員,而業務分析工具則直接擴大到企業所有業務人員。
舉例來說,業務人員可以直接提出業務問題,例如“今年部門業績是否比去年好?”,FineChatBI會將該問題用數據視角拆解成幾個問題,并以多輪對話的形式與業務人員進行進一步確認,再從數據庫中調取所需數據,并以可視化的形式反饋給用戶。
在這一過程中,FineChatBI也會對輸出的結果進行數據異常分析,幫助用戶找出可能存在異常的業務指標,并對其進行歸因,讓用戶發現導致業務異常背后的原因。
此外,FineChatBI還能夠對業務指標進行預測,并生成相應的數據報告。
之所以能夠實現這樣的用戶畫像跨越,AI大模型能力在其中功不可沒。
相比于上一代問答式BI,今天FineChatBI的最大區別就是利用了大模型的泛化能力。它能夠在通用場景下理解用戶所提出的業務問題,并拆解成對應的數據問題,從而跨過了此前業務人員無法提出正確問題的門檻。
“比如同樣都是銷售額,不同公司有不同的叫法,而利用大模型的泛化能力,我們一次性幫你配100個叫法。另外,我們還可以連接你企業的知識庫,只要你輸入進去,產品就能理解你說的‘銷售額’是什么意思?!标惷粼谂c「甲子光年」訪談時表示。
但用過大模型產品的用戶都清楚,大模型雖然泛化能力強,但如果不能解決輸出幻覺,就無法用于實際的業務數據分析場景。對此,帆軟給出的解題思路是:Text2DSL。
簡單來說,Text2DSL是一種AI技術,讓用戶能夠用自然語言提問,由AI將問題轉化成業務用戶可理解、可干預的指令指導計算機行動(例如:查詢指標A在維度B上的分組匯總,并用柱圖展示結果),從而避免讓大模型用自己的“黑盒子”直接自己生成業務用戶無法理解的結果。
FineChatBI架構圖,來源:帆軟
從FineChatBI的技術架構層面看,大模型處于“對話管理層”,用于支持對話引擎的意圖分類、意圖理解、思路拆解及上下文管理等能力。而FineChatBI的能力底座,依舊是數據連接、建模計算、搭建渲染、權限管理等BI需要具備的基礎能力。
也就是說,帆軟的FineChatBI只是利用了大模型的泛化能力來完成產品與用戶的對話交互,而BI所必備的能力底座和配置管理等,依舊需要建立在已有的BI能力之上。而這正是帆軟在過去18年里一直積累且最擅長的事。
事實上,即使AI大模型已經如此普及,能夠真正做好一款對話式BI產品也并非易事。因為對話式BI并不是直接建立在大模型之上,它的底層需要極強的BI能力建設,這也正是ChatGPT等產品不能代替BI的根本原因。
以“可控生成、可信查數”為基礎,帆軟用FineChatBI完成了“思路拆解→數據查詢→異常檢測→歸因分析→趨勢預測→報告生成”的整個數據分析閉環。
3.更大的想象空間:業務決策入口
在「甲子光年」看來,FineChatBI在技術上利用Text2DSL把對話式查數這件事做到極致,技術上采用完全可控的方式取到可信的數據;同時利用大模型內嵌的hypothesis testing等統計學知識和分析思路生成能力,補齊業務人員認知和能力上的差距,實現對話式的業務分析,讓業務人員能夠真正用起來。
FineChatBI第一次讓帆軟“人人都是數據分析師”這句口號成為了可能。
但帆軟未來的想象空間并不止于此。
在智能化階段都已經開始的今天,業務產生數據、數據指導業務的理念早已普及。而帆軟FineChatBI的出現,讓我們真正看到了“數據從業務中來,最終要回到業務”的可能性。
不難想象未來會出現這樣一個場景:當業務人員問了一個業務問題,FineChatBI反饋數據之后,通過異常分析發現了數據指標問題。緊接著,FineChatBI直接為對應的系統(例如采購系統)生成一條指令,幫助業務人員在做出決策的同時,完成業務指令的下達。
從AI大模型所帶來的智能體(AI agent)普及的角度來看,這種場景在未來一定會實現。
對于BI來說,這無疑將是一個巨大的業務變革。
過去,BI一直被看做是輔助決策系統。而如果上述場景一旦實現,就意味著FineChatBI從一個輔助工具直接變成了實現業務閉環的入口,一個讓業務人員實現從提出業務問題,到完成業務決策的入口。
當然,這種可期待的未來并非帆軟一家廠商就能完成,而是需要整個AI與BI生態的共同建設。
今天,帆軟通過服務30000+客戶,覆蓋了國內最廣泛、豐富的客戶和場景。這些場景的積累為帆軟建立了巨大的優勢,讓我們能夠快速收斂場景、驗證功能,也是今天FineChatBI能夠得以問世的關鍵所在。
實際上,在AI大模型開始出現后,業內就開始流傳BI即將被AI替代的論調。但基于30000+客戶的實際服務經驗,帆軟認為,AI與BI的關系不是簡單相加的關系,而是“AI for BI”。
在訪談中陳敏直言,AI技術并不能替代BI,而是盡可能借助AI的相關能力,提升BI工具在各環節的效率、降低BI工具的上手和使用門檻,讓更多領導和業務人員把BI用起來,幫助客戶最大化地用好BI工具的價值。
“畢竟只有讓越來越多的人都能更簡單的使用BI,BI的生態才能更完善,帆軟的使命才有可能實現?!标惷粽f。
(封面圖來源:帆軟)