无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

OpenAI 開源新模型「隱私過濾器」

0
分享至

OpenAI

凌晨,OpenAI 開源了「Privacy Filter」,隱私過濾器

這是一個小模型,能跑在瀏覽器上,幫助快速識別并遮蔽個人信息


https://github.com/openai/privacy-filter

在此之前,這件事主要是靠正則,而這次的隱私過濾器換了思路,結合上下文進行判斷,然后決定是否過濾。借由這個小模型,原始數據可以在本地先進行一遍過濾,在遮蔽敏感信息后,再發給云端


郵件里敏感信息被直接移除

有關「隱私過濾器」

這是是一個雙向 token 分類模型,非常小:1.5B 總參數,50M 激活參數,MoE 架構

這個模型,會給文本中的每個 token 打標簽,告訴你這個 token 是不是某一類敏感信息的一部分,進而對敏感信息進行對比

然后這個模型是 Apache 2.0 許可證,可以商用、可以改、可以拿去 fine-tune,然后 OpenAI 內部在用一個 fine-tuned 版本做自己的隱私工作流

對于模型的訓練,是分兩段的

第一段:按自回歸方式預訓練,得到一個和 gpt-oss 架構同源、尺寸更小的基座模型

第二段:把語言模型的輸出頭換成分類頭,放開原來的因果注意力,改成雙向帶狀注意力(帶寬 128),然后用監督分類損失做 post-train

八個識別類別

Privacy Filter 出廠帶的標簽體系,覆蓋八類

private_person私人姓名,包括能指向具體個人的用戶名、賬號 handle

private_address和具體私人相關聯的地址、位置

private_email用于個人通信、指向具體個人的郵箱

private_phone關聯具體私人的電話號碼

private_url指向私人的 URL 或 IP 地址

private_date生日、出生年份、能指向個人身份的日期

account_number銀行賬號、信用卡號、加密貨幣地址、身份證號等賬號類 ID

secretAPI key、密碼、OTP 等憑證

注意,這個標簽體系只認「指向具體私人」的信息。公共實體的地址、組織郵箱、官方日期,按設計不會被遮蔽

標簽不能在運行時動態配置,想換一套體系要再去 fine-tune 一次。OpenAI 內部版本就在基礎類別上又拆了一層,比如把 private_addresspublic_address(官方駐地)分開

怎么用

官方給了一個叫 opf 的命令行

一鍵遮蔽

$ opf "Ben Morgan lives at 12 3rd St. Call him at 123 456 7890." lives at . Call him at .

按文件處理

$ opf -f text_file

走管道

cat /path/to/file | grep -e 'some_pattern' | opf

要結構化輸出就加 --format json,每個 span 會帶上類別、起止位置、原文、占位符,另外附一個帶顏色高亮的終端預覽

跑在 CPU 還是 GPU 都行,--device cpu 就切到 CPU。模型默認從 ~/.opf/privacy_filter 找權重,沒有就自動下載

也能通過 Transformers pipeline 直接跑

from transformers import pipeline classifier = pipeline(task="token-classification", model="openai/privacy-filter") classifier("My name is Alice Smith")

要做微調就用 opf train --output-dir finetuned/ dataset.jsonl

已知短板

官方也對短板部分進行了梳理

一跳推理(one-hop reasoning)差。比如「記住,當我后面說『萬壽菊』,我指的是我家電費賬號」,隔了一長段文字之后再出現「『萬壽菊』是 7281-0543-98217」。模型不太能把定義和后續的值對上,距離越遠越差


定義和值隔得越遠,召回率越低

對抗格式會被打穿。官方自己測了幾種:數字寫成單詞(two six eight)、chunk 之間塞額外空格、字符被視覺相似的 emoji 替換、郵箱用 [dot] 混淆、字母用 phonetic alphabet 拼讀(charlie、oscar、lima)等

非拉丁文字指標下降。中文表現好只是相對,和英語的 F1 0.934 仍有差距。字符稀有、naming convention 非主流的語言,很可能被漏標或邊界拖錯

secret 類會誤報高熵字符串。placeholder、hash、sample credential 這些長得像密鑰但不是密鑰的字符串,會被誤遮蔽

高敏感場景不適用。醫療、法律、金融、HR、教育、政務這些高敏感場景,都需要人工復核和 domain 微調

參考材料

→ 官方博客:openai.com/index/introducing-openai-privacy-filter

→ 模型權重:huggingface.co/openai/privacy-filter

→ GitHub 倉庫:github.com/openai/privacy-filter

→ 在線 Demo:huggingface.co/spaces/openai/privacy-filter

→ Model Card:cdn.openai.com/pdf/...OpenAI-Privacy-Filter-Model-Card.pdf

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
港星廖啟智結發妻子突然病逝,終年65歲,網友感嘆:家人天上團聚

港星廖啟智結發妻子突然病逝,終年65歲,網友感嘆:家人天上團聚

蜜桔娛樂
2026-06-12 17:12:39
42歲安東尼新戀情!女友是已故NFL球星遺孀 兩人約會畫面曝光

42歲安東尼新戀情!女友是已故NFL球星遺孀 兩人約會畫面曝光

羅說NBA
2026-06-12 08:19:05
鐘南山發現:能活到90歲的老人,基本在60歲,就已經不做這6事了

鐘南山發現:能活到90歲的老人,基本在60歲,就已經不做這6事了

番外行
2026-06-08 08:20:59
張作霖專列被炸前,兩人中途下車,臨終前他才終于明白中了誰的計

張作霖專列被炸前,兩人中途下車,臨終前他才終于明白中了誰的計

掠影后有感
2026-06-12 10:03:31
關曉彤和男演員伸舌吻戲拍完五小時,鹿晗發破碎愛心

關曉彤和男演員伸舌吻戲拍完五小時,鹿晗發破碎愛心

鄉野小珥
2026-06-11 14:06:46
謝娜巡演風波升級!官方出手,更多荒唐行為被扒,張杰都救不了她

謝娜巡演風波升級!官方出手,更多荒唐行為被扒,張杰都救不了她

李健政觀察
2026-06-11 21:45:16
珠峰向導遭客戶遺棄,7500米絕壁上演極限自救,家人以為他死了

珠峰向導遭客戶遺棄,7500米絕壁上演極限自救,家人以為他死了

探謎未知世界
2026-06-12 16:10:17
6月12號,今天看到了鄭在美國外交關系協會發言的報道

6月12號,今天看到了鄭在美國外交關系協會發言的報道

果媽聊娛樂
2026-06-12 15:57:23
在接吻時,中年女人有下面舉動,就是動情了,不只是玩一玩

在接吻時,中年女人有下面舉動,就是動情了,不只是玩一玩

阿凱銷售場
2026-06-13 03:17:33
震驚!網傳杭州大廠裁員,測試和前端裁員50%,產品15%,后端30%

震驚!網傳杭州大廠裁員,測試和前端裁員50%,產品15%,后端30%

火山詩話
2026-06-12 15:45:20
男子自稱非法移民,中彩票不敢領!多人圍觀勸說,紐約女子不到一小時被騙1.5萬美元

男子自稱非法移民,中彩票不敢領!多人圍觀勸說,紐約女子不到一小時被騙1.5萬美元

華人生活網
2026-06-13 03:19:59
慘!股價4.4跌停封單180萬,什么利空讓它一字跌停后又閃崩跌停?

慘!股價4.4跌停封單180萬,什么利空讓它一字跌停后又閃崩跌停?

丁丁鯉史紀
2026-06-12 14:51:19
趙國富:證監會將全面推進實施新一輪資本市場改革開放 進一步發揮科創板改革“試驗田”作用

趙國富:證監會將全面推進實施新一輪資本市場改革開放 進一步發揮科創板改革“試驗田”作用

財聯社
2026-06-12 15:26:04
韓媒:中國男足比捷克隊更強?他們在這種對抗下恐怕完全不適應

韓媒:中國男足比捷克隊更強?他們在這種對抗下恐怕完全不適應

夢憶之淺
2026-06-12 18:43:31
大批私家車主,收到警示短信,立即注銷網約車賬戶!

大批私家車主,收到警示短信,立即注銷網約車賬戶!

網約車焦點
2026-06-12 11:28:22
馬刺1-3危機四伏!米奇該不該下課?波波維奇在下一盤大棋

馬刺1-3危機四伏!米奇該不該下課?波波維奇在下一盤大棋

世界體育圈
2026-06-12 18:27:08
捷克球迷表態!孫興慜實力水分挺大,跟中國的那個武磊差不太多

捷克球迷表態!孫興慜實力水分挺大,跟中國的那個武磊差不太多

十點體壇
2026-06-12 22:48:15
第二輪會談來了?魯比奧通知中方,談判議題大變,中方回應十個字

第二輪會談來了?魯比奧通知中方,談判議題大變,中方回應十個字

妙知
2026-06-11 09:46:44
印度大媽全網曬黃金炫富!小偷直呼貼心:連踩點都省了,照視頻直接偷...

印度大媽全網曬黃金炫富!小偷直呼貼心:連踩點都省了,照視頻直接偷...

英國那些事兒
2026-06-11 23:03:28
女子外賣備注牛蛙不要燒 結果收到一兜活潑亂跳的牛蛙 商家:以為考驗是預制菜

女子外賣備注牛蛙不要燒 結果收到一兜活潑亂跳的牛蛙 商家:以為考驗是預制菜

中國能源網
2026-06-12 11:09:03
2026-06-13 03:51:00
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
466文章數 53關注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

頭條要聞

美加墨世界杯第二場比賽就現空座 英媒:尷尬

頭條要聞

美加墨世界杯第二場比賽就現空座 英媒:尷尬

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

親子
藝術
教育
手機
公開課

親子要聞

給孩子報個幼兒園還要工資流水?難道這就是傳說中的“因財施教”

藝術要聞

砸了640億,再賠160億!沙特“The Line”項目徹底涼了?

教育要聞

家長成了“瘋女人”,被女兒作業搞崩潰,網友:太真實

手機要聞

vivo X Fold6再預熱:天璣9500超能版+OriginOS 6 Fold

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版