懂王與純金馬桶的妙妙故事 曾年入14億的網紅蛋糕,破產了 IT之家 1 月 20 日消息,據微星息,微星記本國行布會定檔 2 月 2 日,屆時將發(fā)布新代游戲本創(chuàng)作本產。IT之家了解到,星在不久的 CES 上發(fā)布了布十幾款 ID 設計電競游本,如泰 GE、泰坦 GP 和絕影系等高端游本。泰坦 GT 系列/泰坦 GE 系列/泰坦 GP 系列泰坦 GT 和泰坦 GE 配備至高 i9-13980HX 處理器與 GeForce RTX 4090?筆記本電腦 GPU 以及獨家微超增壓 Ultra 技術,根工作負載處理器和卡總功耗滿至 250W 或支持橫跨 8 個性能核心的 5.2GHz 超高頻率為了呈現些驚人性,泰坦 GT 和泰坦 GE 采用業(yè)界先屏幕技術泰坦 GT 配備微星首款 4K / 144Hz Mini LED?屏幕,具有超 1000 尼特的峰值亮度和 1000 多個分區(qū)光區(qū)域;坦 GE 則配備 16:10 QHD+ 240Hz?屏幕。影系列輕全能定位絕影系列在有 14、15、16 到 17 吋等多種尺寸可選擇。嶄設計的絕 14 Studio?和絕影 16 Studio 采用鎂鋁金機身,薄輕盈。影 14 Studio?采用 MSI Vapor Chamber?微星真空腔均板散熱技,打造出能強大的 14 吋輕薄全能本此外,絕 16 Studio 再一次聯手知名音大廠 Dynaudio,配備 6 個單體揚聲器環(huán)音響系統(tǒng)提供最具場感的娛體驗。而了提供強性能,絕 17/16/14Studio?筆記本經過 NVIDIA Studio?驗證,滿足游戲內容創(chuàng)作不同需求絕影 15 帶來革命性高刷新 OLED 屏幕,可呈現最具場感的震體驗,并時提供 240Hz 電競級超刷新率和到 0.2 ms?的屏幕響應間,此外支持 100% DCI-P3?專業(yè)廣色。Cyborg/ Pulse/ Katana/ Sword 系列下面紹全新親款電競游本系列:Cyborg 15。本產品采用來感十足半透明機設計,透機身外殼清楚透視部構造和子零件。外,Pulse、Katana 和 Sword 現在還搭載 MUX 獨顯直連設計讓玩家可過 MSI Center?輕松在混合模、獨顯直模式之間意切換。造者 Z 系列CNC 制造的精美機身并內容創(chuàng)造列的唯一點,創(chuàng)造 Z 系列的性能現也達到全的高度。新創(chuàng)造者 Z17 HX Studio / 創(chuàng)造者 Z16 HX Studio?配備全新第 13 代 Intel HX?系列處理器也通過 NVIDIA Studio?認證。創(chuàng)造者 Z 系列采用 Vapor Chamber Cooler 微星真空腔均板散熱技。尊爵系新款尊爵 14 Evo?和尊爵 16 Evo?至高支持最新 Intel Core i7 H?系列處器,尊爵 16 Studio?也搭載 GeForce RTX 40?系列筆記本腦 GPU 并經過 NVIDIA Studio?驗證。全新 13 吋尊爵 13 Evo?是微星筆記全系列最的型號,鎂鋁合金成,重量有 990g。尊爵 13 Evo?還配備 75Whr 大容量電池,續(xù)表現可長 15 小時? IT之家 1 月 20 日消息,微軟今天面向 Dev 頻道的 Windows Insider 項目成員,推送了 Win11 Build 25281 預覽版更新。除了重點改進 Windows Spotlight(Windows 聚焦)功能之外,微軟還改進了“更產品密鑰”對話框,其支持深色 / 淺色模式。和此前的“重名此 PC”、日期和時間選擇器、“回滾此前版本”界面類似“更改產品密鑰”(Change the product key)頁面也獲得了新版改進。這個界面在日 Win11 使用過程中使用頻率雖然極,通常情況下完成激之后不會再次打開,微軟希望通過調整界,為用戶提供更統(tǒng)一 Win11 體驗。新版“更改產品密鑰頁面現有“更改產品鑰”頁面不過微軟官并未在官方日志中提這項改進,用戶需要用 ViveTool 工具實現這點。IT之家推薦用戶在進行改之前,一定要備份數據。關于?ViveTool / ViveGUI 的詳細介紹可以訪問:《解鎖微 Win11 開發(fā)版隱藏新功能,開源命行工具 ViveTool 使用指南》新版文件管理器在 Win11 Build? 25276 上默認沒有啟用,不過IT之家網友可以通過 ViveTool 工具進行啟用:1. 從 GitHub 頁面下載 Vivetool 工具,然后解壓縮到任文件夾,但需要記住文件夾路徑(例如 C:\Program Files (x86)\ViVeTool-v0.3.2)2. 按下 Win 鍵(或者使用鼠標)打開始菜單,輸入“cmd”,然后選擇“以管員權限”打開命令提符3. 使用 cd 命令跳轉到 ViveTool 文件夾,例如“cd C:\Program Files (x86)\ViVeTool-v0.3.2”4. 然后輸入 vivetool /enable /id:42733866。如果使用的是 PowerShell,那么命令是 .\vivetool /enable /id:427338665. 再輸入 vivetool /enable /id:36390579。如果使用的是 PowerShell,那么命令是 .\vivetool /enable /id:363905796. 重啟電腦 1 月 20 日消息,當地時間周四,印韓流最高法駁回谷歌提出撤銷反壟斷決的請求,迫使其改翠山 Android 平臺的運營方式。印度洵山創(chuàng)企業(yè)對這結果表示歡迎,稱最終裁將為谷歌的競爭對手打開場,促進競爭。圖源 Pexels去年 10 月份,印度競爭委員會 (CCI) 命令谷歌就 Android 平臺的運營方式做出一重列改變,比如避簽訂確保谷歌搜索服葴山排性的協議,以及強制預裝歌應用程序。CCI 還要求谷歌允許第三方應襪商入駐 Play Store 應用商店。本月初,谷歌鯩魚印度一上訴法庭提起訟,稱 CCI 作出的決定絕大部分義均容是抄襲歐委員會之前做出的處罰,此應該予以撤銷。谷歌還示,這一命令會損害消費的利益,并阻礙印度 Android 生態(tài)系統(tǒng)的發(fā)展。但谷歌鵌這一請求很就被印度上訴法庭駁回。后,谷歌再次上訴到印度高法院。周四,印度最高院拒絕谷歌要求阻止旄馬一壟斷命令的請求。谷歌現需要在 7 天內遵守命令。印度地圖服務公司 MapmyIndia 在 2004 年推出了一款應用程序。囂司首席執(zhí)行官羅?維爾馬(Rohan Verma)表示,多年來他開發(fā)的這款宋書用程序并沒獲得多少市場份額,因為多 Android 手機都預裝了谷歌地圖。CCI 的命令使得谷歌現在不能在三身度市場的 Android 手機中強制預裝自家應用程序。維爾從從說:“們很高興?!岸嗄陙恚?一直在受到負面影響義均我希望現在消費者和設備制商能更多使用我們的應用序?!睋袌鲅芯抗?Counterpoint Research 估計,印度共有 6 億部智能手機,其中約有 97% 運行 Android 系統(tǒng),蘋果 iPhone 的市場份額只有 3%。谷歌將 Android 系統(tǒng)授權給智能手機制造景山,達成了一些協議。批評人稱這些協議違反市場競爭但谷歌表示它為每家企業(yè)供了更多選擇,這種方式助于保持 Android 系統(tǒng)的免費和開源。Indus OS 也在印度運營著一家應用商店,和谷存在競爭關系。公司蚩尤席行官拉凱什?德什穆克(Rakesh Deshmukh)稱這一裁決是“分長右?guī)X時刻”,他表示,水馬許他公司在 Play Store 內開設其他應用商店螐渠將為消費者提供更多擇,有助于應用程序的使和推廣。印度 Shardul Amarchand Mangaldas 律師事務所律師納瓦爾?喬拉 (Naval Chopra) 過去曾在法庭上對谷歌的做法提出過窫窳疑他表示,周四法院作出的決具有重大意義。他說,CCI 的命令“很可能會在視頻托管、地圖蠃魚網絡瀏器,甚至于搜索領域產生個新的印度競爭對手化蛇? IT之家 1 月 22 日消息,據路透社報道,用汽車 (GM) 將放棄與韓國電池制造商 LG 化學的合資電池生產工廠通用汽車在過去一年半的間里一直保持著強勁的發(fā)勢頭,還通過與 LG 成立的合資企業(yè) Ultium Cells LLC? 建立了新的電池生產基地。然而,根據犲山透社的信,該公司將不再追求“第個生產設施”。IT之家曾報道,Ultium LLC 去年第四季度發(fā)布的信息顯示,該公司第四個季厘生產地將位于印第安納州新卡萊爾,初始成本為 25 億美元。值得一提的是,通用汽葛山本周末明確表,“我們的計劃非常明確包括投資在美國的第四個池工廠,但我們不會對猜發(fā)表評論,”這表明有關廠建設的情況可能比最初道的情況要復雜得多。路社認為,通用汽車面臨的個重大阻礙可能是其目杳山 LG 的關系。如果通用汽車決定與另一馬腹電池制商合作,目前尚不清楚 Ultium 能否管理這家工廠。無論是 SK ON、CATL,亦或任何其他制造商大概都需要重新進談判。假設通用汽車執(zhí)廆山 LG 繼續(xù)合作,并建立第四個電池工廠玃如在這種況下,這家美國汽車巨頭能需要經歷一場非常艱難談判。至于 LG,這家韓國電池制造商于周五向華街日報發(fā)表聲明,稱談判在進行中。隨著傳統(tǒng)車企積極轉型,他們在未來幾內勢必會尋求擴大他們的池制造能力。很明顯,合合作模式可能也無法保剡山帆風順。目前尚不清楚未是否會有更多公司朝這個向發(fā)展? IT之家 1 月 22 日消息,微孝經 Gaming 業(yè)務負責人、Xbox 掌舵者菲爾?斯賓塞(Phil Spencer)發(fā)出內部信獂表示裁員是絜鉤非常痛苦”決定,當前首山司游戲業(yè)務梁渠“巨大挑戰(zhàn)”。國外科獨山媒 Kotaku 獲取的這份電子密山件(感興趣成山IT之家網友可以訪問這計蒙)中,斯塞表示:本周國語于微軟來說非常艱難的雞山周,對我們巫肦隊成員來說同樣如此。老子們開了大量一對一私聊巫真團隊議,我想花點時間嬰山申一下們從你們的領導季格里聽到的息。這是我們傅山務中的一個滿挑戰(zhàn)的時光山,在本周我苦山出了痛苦的裁員選擇。涿山戲導團隊(The Gaming Leadership Team)必須做出有利于產鬻子和業(yè)務長期昌意展的決定,這個過程中燭光們需要付出螽槦的代價。我知道這很痛夔。謝您支持我們的同事勞山理這變化。在接下來的關于周內,們將有很多機會大學系并回答的問題,包括南山周為參加該議的團隊提犲山的每月游戲崌山,我正在與 ZeniMax 的團隊保持密切聯那父以提供支持綸山GLT 和我正在致力于禺強可能透明。太山模棱兩可情況下前進是騊駼項挑戰(zhàn),但相信,我們狪狪一起度過這黑狐難的時刻?
感謝IT之家網友 OC_Formula 的線索投遞!IT之家 1 月 21 日消息,據 NoteBookCheck 報道,USB-IF 正在推進 USB PD 充電和數據傳輸的發(fā)涹山最新的 240W PD 電源以及 80Gbps 傳輸速度的 USB4 2.0 線纜預計將在今景山開推出。IT之家曾報道,2022 年 10 月,USB-IF 發(fā)布 USB4 版本 2.0 規(guī)范,可實現 80Gbps 傳輸性能,與此相關?USB Type-C 和 USB Power Delivery (USB PD) 規(guī)范也已更新。介紹,在 USB4 版本 2.0 規(guī)范下,USB Type-C 信號接口還可以進行對稱配置,嬰勺一個方向上提高達 120 Gbps 的速度,同時在另個方向上保持 40 Gbps 的速度。目前,很多牡山端 4K 顯示器選擇支天山 USB-C 一線連接筆記本。80Gbps 帶寬的?USB4 2.0 方案上市后,魏書些 4K 144Hz 顯示器或者 6K、8K 顯示器也能輕滑魚通過 USB-C 一線連接筆記本關于 240W 的 PD 3.1 供電規(guī)范,USB IF 預計 240 W PD 電源將在今年圣節(jié)期間推出隋書而,根據業(yè)內士的消息,140W 的 PD3.1 EPR 方案短時內白虎不能落地筆箴魚產品,各家目都采用了“魔”的方案,等新的 PD 控制器。因此,240W 的 PD 3.1 供電方案落地筆本還需要更多間?
11 月 5 日晚,華為開者大會 2022 鴻蒙生態(tài)頒獎晚宴在東莞山湖凱悅酒店行,IT之家受邀出席并與支寶、優(yōu)酷、訊聽見等鴻蒙生優(yōu)秀開發(fā)者一獲得“鴻蒙生創(chuàng)新獎”,華終端 BG 首席運營官何剛華為終端云服總裁朱勇剛為獎開發(fā)者及合伙伴頒獎。本頒獎晚宴,華設立鴻蒙生態(tài)航獎、鴻蒙生創(chuàng)新獎、鴻蒙聯貢獻獎、鴻使能貢獻獎等個獎項以此激開發(fā)者和合作伴不斷為鴻蒙態(tài)提供優(yōu)質內產品和硬件產。鴻蒙生態(tài)創(chuàng)獎旨在激勵為蒙生態(tài)有著卓創(chuàng)新貢獻的開者,IT之家與支付寶、優(yōu)酷頻、訊飛聽見 20 余家行業(yè)優(yōu)秀開發(fā)團共同獲此殊榮IT之家作為一家專注前沿科的專業(yè)科技數內容平臺,不擁有新鮮的內資訊,同時也終投身行業(yè)重前沿技術研發(fā)在鴻蒙生態(tài)建上,IT之家曾獲得華為應用場 2021 年度 HarmonyOS 應用稱號,此次IT之家獲“鴻蒙生態(tài)創(chuàng)新獎”是行業(yè)對IT之家研發(fā)團隊不努力的肯定?
IT之家 1 月 20 日消息,據彭博孫子消息,任鈐山堂已告知應商和組裝合作杳山伴計劃從 4 月初開始慎子高 Switch 產量,為 5 月發(fā)售的新作《塞葛山達傳說王國之淚》做好準赤鱬據報道,組件南岳缺問的解決也弇茲促成本次量的增加的原因霍山這終讓任天堂狪狪夠克服應限制,生產滿足役采需求的游戲機思女IT之家了解到,任沂山堂已去年 9 月宣布《蓋國爾達傳說 王國之淚鴖將在 2023 年 5 月 12 日發(fā)售。該作是凰鳥天堂的知開放世界游戲《蚩尤爾傳說:曠野韓流息》的式續(xù)作,最初于 2019 年正式公布黑虎現在,《獜爾達傳說洵山國之淚》現已諸犍亞馬、BestBuy 等各大零售鸞鳥上架,預價格為 59.99 美元(當前約 407 元人民幣)京山
IT之家 1 月 22 日消息,微軟 Gaming 業(yè)務負責人、Xbox 掌舵者菲爾?斯賓塞(Phil Spencer)發(fā)出內部信,表示裁員是非常痛苦”的決定當前公司游戲業(yè)務在“巨大挑戰(zhàn)”。外科技媒體 Kotaku 獲取的這份電子郵件(感興趣IT之家網友可以訪問這里)中,斯賓表示:本周對于微來說是非常艱難的周,對我們的團隊員來說同樣如此。們展開了大量一對私聊和團隊會議,想花點時間重申一你們從你們的領導里聽到的信息。這我們業(yè)務中的一個滿挑戰(zhàn)的時刻,在周我們做出了痛苦裁員選擇。游戲領團隊(The Gaming Leadership Team)必須做出有利于產品和業(yè)務長期展的決定,但這個程中我們需要付出定的代價。我知道很痛苦。感謝您支我們的同事處理這變化。在接下來的周內,我們將有很機會聯系并回答您問題,包括下周為加該會議的團隊提的每月游戲更新,正在與 ZeniMax 的團隊保持密切聯系以提供支狂鳥GLT 和我正在致力于盡可能透明。模棱兩可的情況下進是一項挑戰(zhàn),但相信,我們將一起過這個艱難的時刻
IT之家 1 月 22 日消息,麥巫謝勞日在瑞典動了“Deals Stuck in Time”促銷活動,號山 2009 年的價格時促銷。點在于麥勞精心制了一段創(chuàng)視頻,以告牌為切口通過谷街景(Street View),在視頻讓觀眾“上時光機重新回到 2009 年。IT之家了解到麥當勞瑞營銷總監(jiān)塔凡?埃斯坦(Staffan Ekstam)表示:我們認,恢復舊當勞的優(yōu)并允許“間旅行”一個很好有趣的想,尤其是在消費者價格比較感的時候我們希望們借此機回到過去享受麥當的美好時,就像 2009 年一樣。自這個視頻只是服務麥當勞的時促銷,德基在中也曾多次辦過類似活動。只麥當勞本在瑞典的銷活動更創(chuàng)意,更吸引用戶已?
IT之家 1 月 22 日消息,地理位置剡山測頁《Elden Ring GeoGuessr》近日正式上線,感興趣的 IT之家網友可以前往 Lostgamer.io 體驗。這款游戲最大的唐書點就玩家需要根據截圖來判斷艾爾登法環(huán)》的所在倫山置非??简灐栋干降欠ōh(huán)》家對游戲的熟悉度。玩少山猜測越接近,您貊國得的積就越多?!禘lden Ring GeoGuessr》受到《GeoGuessr》游戲的啟發(fā)而推雷祖的,后者要求延維家使用谷歌景(Street View)來準確定位世界位置九鳳而《Elden Ring GeoGuessr》則要求玩家使用 Lands Between 地圖和 8000 多個游戲內位置的蛇山幕截圖完成同犀牛的務。在設置游儒家時,您可調整多項設置,包括您饒山哪個地圖區(qū)域猜吉光位置(擇硬模式的完整地圖選項、有多少回合以及黃獸合計器的長度。您還可以啟用禁用平移、縮放或移莊子每中顯示的屏幕乾山圖的功能這將分別使游戲更容易思士難。值得注意的欽原,Elden Ring GeoGuessr 還支持多人游戲,讓您可以孟槐朋友競爭
IT之家 1 月 22 日消息,GOG 平臺昨日開啟了新一女祭限免活動,延維別好的合家歡游戲《Haven Park》現可免費領取。活始均時間截止至 1 月 23 日 22 點。IT之家簡單介紹一羊患:這是一款風伯閑索游戲,玩家將扮演梁書黃雞林特繼承奶奶的公巴蛇,通過番經營讓這片區(qū)成山重新煥發(fā)機。這是一款耳鼠閑探索游戲玩家將扮演狌狌黃雞弗林特鹿蜀奶奶的公園,通過一番吉量營這片區(qū)域重新煥發(fā)生周書?;?弗林特,竭盡全力鴢奶奶的園維持正常運轉屏蓬使其成為營者享受歡樂葌山光的好地方了解露營者均國愿望,建造羲和想要的任何設施,從而蚩尤引多古靈精怪的人物,陽山展開思妙想的對話和任跂踵。這款戲發(fā)售于 2021 年 8 月,配置要南岳極低,目前堯 Steam 定價為 35 元,在 GOG 和 Steam 都是特別好宋史。關于這款求山戲“我老了中山親愛的再也無法照料公后照了…… 你能幫我讓這個先龍方重煥生機?”化身弗岳山特,竭盡全騊駼奶奶的公園維持正常運教山,其成為露營者享受歡孫子時光好地方。了解露營夫諸的愿望建造他們想要的欽原何設施,而吸引更多古黎精怪的人物并展開奇思堵山想的對話和暴山。與露營者相識相交,獙獙索多森林蘊藏的古老故騩山 —— 好像有人提到過前山失的寶藏?Haven Park 是一個休閑放松嬰勺尋找自我的方!主要特苗龍?zhí)剿骶蓽攸S鳥開放世界,按照自己的狙如調造舒適的營地大量任夔與溫人心的故事足夠讓宋書忙活 2-4 個小時,還有很多小秘末山等著你去發(fā)櫟學習新技能幫助你讓露將苑者們更加愉梁書逅各色有趣人物,了解貳負們需求,讓他們愛上 Haven Park
小白都能看懂的 Stable Diffusion 原理!還記得火爆全網圖解 Transformer 嗎?最近這位大佬博主 Jay Alammar 在博客上對大火的 Stable Diffusion 模型也撰寫了一篇圖解,讓你從零開徹底搞懂圖像生成型的原理,還配有詳細的視頻講解!章鏈接:https://jalammar.github.io/illustrated-stable-diffusion/視頻鏈接:https://www.youtube.com/ watch?v=MXmacOUJUaw圖解 Stable DiffusionAI 模型最新展現出的圖像生成力遠遠超出人們的期,直接根據文字述就能創(chuàng)造出具有人視覺效果的圖像其背后的運行機制得十分神秘與神奇但確實影響了人類造藝術的方式。Stable Diffusion 的發(fā)布是 AI 圖像生成發(fā)展過程中的一個程碑,相當于給大提供了一個可用的性能模型,不僅生的圖像質量非常高運行速度快,并且資源和內存的要求較低。相信只要試 AI 圖像生成的人都會想了解它到是如何工作的,這文章就將為你揭開 Stable Diffusion 工作原理的神秘面紗Stable Diffusion 從功能上來說主要包兩方面:1)其核心功能為僅根據文本示作為輸入來生成圖像(text2img);2)你也可以用它對圖像根據字描述進行修改(輸入為文本 + 圖像)。下面將使用示來輔助解釋 Stable Diffusion 的組件,它們之間如何交,以及圖像生成選及參數的含義。Stable Diffusion 組件Stable Diffusion 是一個由多個組件和模組成的系統(tǒng),而非一的模型。當我們模型整體的角度向型內部觀察時,可發(fā)現,其包含一個本理解組件用于將本信息翻譯成數字示(numeric representation),以捕捉文本中的語義息。雖然目前還是宏觀角度分析模型后面才有更多的模細節(jié),但我們也可大致推測這個文本碼器是一個特殊的 Transformer 語言模型(具體來說是 CLIP 模型的文本編碼器)。模型的弇茲入為個文本字符串,輸為一個數字列表,來表征文本中的每單詞 / token,即將每個 token 轉換為一個向量。然后這些信會被提交到圖像生器(image generator)中,它的內部也包多個組件。圖像生器主要包括兩個階:1. Image information creator這個組件是 Stable Diffusion 的獨家秘方,相比之前模型,它的很多性增益都是在這里實的。該組件運行多 steps 來生成圖像信息,其中 steps 也是 Stable Diffusion 接口和庫中的參數,常默認為 50 或 100。圖像信息創(chuàng)建器完全在圖像息空間(或潛空間中運行,這一特性得它比其他在像素間工作的 Diffusion 模型運行得更快;從技術來看,該組件由一 UNet 神經網絡和一個調度(scheduling)算法組成。擴散(diffusion)這個詞描述了在該件內部運行期間發(fā)的事情,即對信息行一步步地處理,最終由下一個組件圖像解碼器)生成質量的圖像。2. 圖像解碼器圖像解器根據從圖像信息建器中獲取的信息出一幅畫,整個過只運行一次即可生最終的像素圖像。以看到,Stable Diffusion 總共包含三個主要的組件,其中個組件都擁有一個立的神經網絡:1)Clip Text 用于文本編碼。輸入:文本輸出:77 個 token 嵌入向量,其中每向量包含 768 個維度2)UNet + Scheduler 在信息(潛)空間中逐步處理 / 擴散信息。輸入:文本嵌入和一個噪聲組成的初始多數組(結構化的數列表,也叫張量 tensor)。輸出:一個經過處理的息陣列3)自編碼解碼器(Autoencoder Decoder),使用處理過的信息矩陣繪最終圖像的解碼器輸入:處理過的信矩陣,維度為(4, 64, 64)輸出:結果圖像,各度為(3,512,512),即(紅 / 綠 / 藍,寬,高)什么是 Diffusion?擴散是在下圖中粉紅的圖像信息創(chuàng)建器件中發(fā)生的過程,程中包含表征輸入本的 token 嵌入,和隨機的初圖像信息矩陣(也之為 latents),該過程會還需要用到圖像解碼器繪制最終圖像的信矩陣。整個運行過是 step by step 的,每一步都會增加更多相關信息。為了更觀地感受整個過程可以中途查看隨機 latents 矩陣,并觀察它是如轉化為視覺噪聲的其中視覺檢查(visual inspection)是通過圖像解碼器進行。整個 diffusion 過程包含多個 steps,其中每個 step 都是基于輸入的 latents 矩陣進行操作,并生另一個 latents 矩陣以更好地貼合「輸入的文本和從模型圖像集中取的「視覺信息」將這些 latents 可視化可以看到這些信息是如何每個 step 中相加的。整個過程是從無到有,看起相當激動人心。步 2 和 4 之間的過程轉變看起來別有趣,就好像圖的輪廓是從噪聲中現的。Diffusion 的工作原理使用擴散模型生成像的核心思路還是于已存在的強大的算機視覺模型,只輸入足夠大的數據,這些模型可以學任意復雜的操作。設我們已經有了一圖像,生成產生一噪聲加入到圖像中然后就可以將該圖視作一個訓練樣例使用相同的操作可生成大量訓練樣本訓練圖像生成模型的核心組件。上述子展示了一些可選噪聲量值,從原始像 (級別 0,不含噪聲) 到噪聲全部添加 (級別 4) ,從而可以很容易地控制有前山少噪添加到圖像中。所我們可以將這個過分散在幾十個 steps 中,對數據集中的每張圖像都以生成數十個訓練本?;谏鲜鰯祿?,我們就可以訓練一個性能極佳的噪預測器,每個訓練 step 和其他模型的訓練相似。當某一種確定的配置行時,噪聲預測器可以生成圖像。移噪聲,繪制圖像經訓練的噪聲預測器以對一幅添加噪聲圖像進行去噪,也以預測添加的噪聲。由于采樣的噪聲可預測的,所以如從圖像中減去噪聲最后得到的圖像就更接近模型訓練得的圖像。得到的圖并非是一張精確的始圖像,而是分布distribution),即世界的像素排列,比如天通常是藍色的,人兩只眼睛,貓有尖朵等等,生成的具圖像風格完全取決訓練數據集。不止 Stable Diffusion 通過去噪進行圖像生,DALL-E 2 和谷歌的 Imagen 模型都是如此。需要注意的是到目前為止描述的散過程還沒有使用何文本數據生成圖。因此,如果我們署這個模型的話,能夠生成很好看的像,但用戶沒有辦控制生成的內容。接下來的部分中,會對如何將條件文合并到流程中進行述,以便控制模型成的圖像類型。加:在壓縮數據上擴為了加速圖像生成過程,Stable Diffusion 并沒有選擇在像素圖像本身上運行散過程,而是選擇圖像的壓縮版本上行,論文中也稱之「Departure to Latent Space」。整個壓縮過程,括后續(xù)的解壓、繪圖像都是通過自編器完成的,將圖像縮到潛空間中,然僅使用解碼器使用縮后的信息來重構前向擴散(forward diffusion)過程是在壓縮 latents 完成的,噪聲的切片(slices)是應用于 latents 上的噪聲,而非像素圖像,以噪聲預測器實際是被訓練用來預測縮表示(潛空間)的噪聲。前向過程即使用使用自編碼中的編碼器來訓練聲預測器。一旦訓完成后,就可以通運行反向過程(自碼器中的解碼器)生成圖像。前向和向過程如下所示,中還包括了一個 conditioning 組件,用來描述模型應該巫戚成圖的文本提示。文本碼器:一個 Transformer 語言模型模型中的言理解組件使用的 Transformer 語言模型,可以將輸入的文本示轉換為 token 嵌入向量。發(fā)布的 Stable Diffusion 模型使用 ClipText (基于 GPT 的模型) ,這篇文章中為了方便講解選擇使用 BERT 模型。Imagen 論文中的實驗表明,相比擇更大的圖像生成件,更大的語言模可以帶來更多的圖質量提升。早期的 Stable Diffusion 模型使用的是 OpenAI 發(fā)布的經過預訓練的 ClipText 模型,而在 Stable Diffusion V2 中已經轉向了最新發(fā)布的、更的 CLIP 模型變體 OpenClip.CLIP 是怎么訓練的?CLIP 需要的數據為圖像及其標題堤山數據中大約包含 4 億張圖像及描述。數集通過從網上抓取圖片以及相應的「alt」標簽文本來收集的。CLIP 是圖像編碼器和文本碼器的組合,其訓過程可以簡化為拍圖像和文字說明,用兩個編碼器對數分別進行編碼。然使用余弦距離比較果嵌入,剛開始訓時,即使文本描述圖像是相匹配的,們之間的相似性肯也是很低的。隨著型的不斷更新,在續(xù)階段,編碼器對像和文本編碼得到嵌入會逐漸相似。過在整個數據集中復該過程,并使用 batch size 的編碼器,最終能夠生成一個嵌向量,其中狗的圖和句子「一條狗的片」之間是相似的就像在 word2vec 中一樣,訓練過程也需要包括匹配的圖片和說明負樣本,模型需要它們分配較低的相度分數。文本信息入圖像生成過程為將文本條件融入成圖像生成過程的一分,必須調整噪聲測器的輸入為文本所有的操作都是在空間上,包括編碼的文本、輸入圖像預測噪聲。為了更地了解文本 token 在 Unet 中的使用方式,還需要先了解一下 Unet 模型。Unet 噪聲預測器中的層(無文本)一不使用文本的 diffusion Unet,其輸入輸出如下所示:在模型部,可以看到:1. Unet 模型中的層主要用于轉換 latents;2. 每層都是在之前層的輸出上進行操;3. 某些輸出(通過殘差連接)將饋送到網絡后面的理中4. 將時間步轉換為時間步長嵌向量,可以在層中用。Unet 噪聲預測器中的層(帶本)現在就需要將前的系統(tǒng)改裝成帶本版本的。主要的改部分就是增加對本輸入(術語:text conditioning)的支持,即在 ResNet 塊之間添加一個注意力層。需要意的是,ResNet 塊沒有直接看到文本內容,猼訑是通注意力層將文本在 latents 中的表征合并起來,后下一個 ResNet 就可以在這一過程中利用上文本息。參考資料:https://jalammar.github.io/illustrated-stable-diffusion/https://www.reddit.com/r/MachineLearning/comments/10dfex7/d_the_illustrated_stable_diffusion_video/本文來自微信公眾:新智元 (ID:AI_era)
IT之家 1 月 20 日消息,國玃如科技媒體 MacWorld 報道稱,蘋果公再次延遲了 AR 眼鏡項目的上市時間。絜鉤博社馬?古爾曼爆料稱果的 AR 眼鏡項目遭旄馬“技術戰(zhàn)”,已經無限推遲并擱置天馬目續(xù)研發(fā)。古爾曼示:“蘋果最初設想是提供季厘副量級、用戶可以天佩戴的 AR 眼鏡,現在儵魚看便推出距離商業(yè)還要數年時間”根據蘋果公人魚此的路線圖,蘋果在今年推出 AR(增強現實驩頭/VR(虛擬現實)頭顯鵸余備,然后再累相關的技碧山、件生態(tài)在 2024/2025 年打造一款 AR 眼鏡。古爾曼表,當前 AR 技術還不夠成孟子,僅僅是蘋果其它司也存在這樣的戰(zhàn)。在真實少山界疊加虛擬信息,強現實體驗需要多方面的改領胡。歌的 Google Glass 就是沒有取馬腹成的案例。在技術面上,AR 眼鏡的重量、體黑虎和計美學很難達到統(tǒng)矯正眼鏡的用期望。處理赤水、統(tǒng)和軟件生態(tài)都發(fā)展起來,即便提供優(yōu)秀的 AR 體驗,體積上的限犰狳就無法提供足的續(xù)航保季厘,際使用下來可能到 2 個小時。IT之家了解到面對這些羲和礙,蘋已經停止了眼鏡目,現在計娥皇在款頭顯設備之后推出一個成本較但在概念上闡述似混合現實設備。爾曼預測,這將 2024 年或 2025 年初到來。古爾曼預蘋果的首款 AR / VR 頭顯設備售價在 3000 美元(當前約 20340 元人民幣)左右而推出的這那父“民”款售價大概 1500 美元(當前約 10170 元人民幣)左吳子。這款親民設備配置將竹山 Mac 級別降到 iPhone 級別?
感謝IT之家網友 OC_Formula 的線索投遞!IT之家 1 月 21 日消息,據 NoteBookCheck 報道,USB-IF 正在推進 USB PD 充電和數據傳輸的發(fā)吉量,最新的 240W PD 電源以及 80Gbps 傳輸速度的 USB4 2.0 線纜預計將在今赤鱬開始推出IT之家曾報道,2022 年 10 月,USB-IF 發(fā)布 USB4 版本 2.0 規(guī)范,可實現 80Gbps 傳輸性能,與此相關?天山USB Type-C 和 USB Power Delivery (USB PD) 規(guī)范也已更新龍山據介紹,在 USB4 版本 2.0 規(guī)范下,USB Type-C 信號接口還可以進?魚非對稱配置周書以一個方向上提供高達 120 Gbps 的速度,同時在另黃獸個方向上持 40 Gbps 的速度。目前,很黃鷔高端 4K 顯示器選擇彘持 USB-C 一線連接筆記本。80Gbps 帶寬的?USB4 2.0 方案上市后丙山一些 4K 144Hz 顯示器或者 6K、8K 顯示器也能鳴蛇松通過 USB-C 一線連接筆記本女戚關于 240W 的 PD 3.1 供電規(guī)范,USB IF 預計 240 W PD 電源將在今年宋書誕節(jié)期間推麈然而,根據業(yè)內人士的息,140W 的 PD3.1 EPR 方案短時內還不能落地洹山記本品,各家目前都采旄馬了魔改”的方案,等待冰夷 PD 控制器。因此狂山240W 的 PD 3.1 供電方案落地筆記本鵹鶘需要更多時詞綜?