間歇性增強(Intermittent Reinforcement)
定義
不是每次行為都給予增強,而是不定時、不定次地給予增強。這種不可預測的回報模式會產生極高的行為反應率,且行為極難消退。B. F. Skinner 與 Charles Ferster 在 1957 年《Schedules of Reinforcement》中系統研究了這個現象,後續神經科學研究進一步揭示了其背後的多巴胺機制。
在人際關係層面,間歇性增強被認為是創造心理依賴的核心機制——這不只是實驗室裡的概念,也是解釋許多「為什麼那麼難離開」的關鍵。
核心機制
為什麼間歇性增強比持續增強更有力
Skinner 的實驗室發現了一個反直覺的事實:不穩定的獎勵比穩定的獎勵產生更頑強的行為:
| 增強模式 | 行為特徵 | 消退速度 | 例子 |
|---|---|---|---|
| 持續增強(CRF) | 穩定但中等的反應率 | 快——一旦停止增強,行為迅速消失 | 每次投幣都出飲料的販賣機 |
| 間歇性增強(VR) | 高且不穩定的反應率 | 極慢——即使長期沒有增強仍持續 | 吃角子老虎機 |
關鍵原理是不可預測性啟動多巴胺系統。Schultz 等人(1997)的神經科學研究發現,大腦對不確定的獎勵比確定的獎勵產生更強的多巴胺反應。這不是意志力的問題,是神經化學層面的硬體設計。
在人際關係中怎麼運作
間歇性增強在關係中的運作有一個典型模式:對方有時溫柔體貼(增強)讓你產生希望;有時冷漠殘忍(無增強或懲罰)讓你產生焦慮;焦慮時又突然溫柔(增強)讓你如釋重負,依賴加深。結果是你不斷「賭」對方會回到好的那一面。
這個模式對受害者的心理代價極高,但從行為學角度它又完全符合預測——間歇性獎勵產生的行為最頑強。所以離不開有毒關係的人不是「蠢」或「願意被虐」,他們的大腦正被一套強大的行為制約機制綁住。
自戀虐待循環的行為機制
臨床心理學觀察到的自戀虐待循環(narcissistic abuse cycle)可以用間歇性增強來解釋每個階段的心理效果:
| 階段 | 增強操作 | 受害者心理狀態 |
|---|---|---|
| 理想化 Idealize | 大量正增強:讚美、關注、承諾 | 幸福感、依賴建立 |
| 貶低 Devalue | 增強撤除 + 間歇性懲罰 | 困惑、自我懷疑、更努力討好 |
| 拋棄 Discard | 完全撤除增強 | 戒斷反應、極度焦慮 |
| 回吸 Hoover | 突然恢復增強 | 如釋重負、循環重啟 |
Dutton 與 Painter(1993)指出,間歇性增強結合權力不對等(power imbalance),是創傷連結(trauma bonding)形成的兩個核心條件。他們的研究對象是受虐伴侶,但同樣的機制在職場霸凌、高壓教養中也看得到。
其他常見場景
間歇性增強不只出現在親密關係。賭博是最典型的——不定時中獎驅動賭癮無法停止。社群媒體不定時獲得讚或留言,驅動你強迫性刷新。不穩定的主管有時讚賞有時暴怒,讓員工持續焦慮但不敢離開。若即若離的伴侶有時親密有時疏遠,讓你過度投入、持續追求。
這些場景的共同結構都是:獎勵的時機不可預測,這個不可預測性本身就是讓你無法抽離的機制。
🔍 如何觀察 / 如何實作
觀察信號:
- 當主管偶爾對你特別好(請你吃飯、公開讚美),你會覺得「其實他不是壞人」,然後忘記上次被當眾羞辱的事 — 這是間歇性增強在製造希望
- 當你不斷刷社群媒體,明知大部分時候都沒什麼新東西,但偶爾看到一則很有趣的貼文就停不下來,這是變動比率增強在驅動你的行為
- 當你在一段關係中覺得「他有時候真的很好」來合理化大部分時候的冷漠或傷害,注意:正是那個「有時候」讓你無法離開
實作練習:
- 回想一段讓你難以離開的關係(人際、職場、甚至跟某個 App 的關係)。列出「好的時刻」和「不好的時刻」的比例。如果不好的時刻明顯更多,但你仍然留下來,問自己:是這段關係真的值得,還是偶爾的好讓我產生了不成比例的希望?
- 觀察你手機上使用時間最長的 App,分析它的回報模式:它是每次使用都給你滿足(持續增強),還是偶爾才出現讓你覺得「值了」的內容(間歇性增強)?如果是後者,你的使用行為正在被設計過的增強時制維持
相關概念
- → 操作制約 間歇性增強是操作制約中的變動比率增強時制
- → 行為消退 間歇性增強產生的行為是最難消退的
- → 自戀虐待循環 理想化—貶低—拋棄—回吸循環的行為機制基礎
- → 創傷連結 Dutton & Painter 模型中間歇性增強是核心要素
- → 習得性無助 長期間歇性增強可能最終導致習得性無助
💭 Think About This
「如果一台販賣機有時出飲料有時不出,你會一直投幣。如果一個人有時對你好有時對你壞,你會一直留下來。機制是一樣的。」
References
- Ferster, C. B., & Skinner, B. F. (1957). Schedules of Reinforcement. Appleton-Century-Crofts.
- Dutton, D. G., & Painter, S. (1993). The battered woman syndrome: Effects of severity and intermittency of abuse. American Journal of Orthopsychiatry, 63(4), 614-622.
- Schultz, W., Dayan, P., & Montague, P. R. (1997). A neural substrate of prediction and reward. Science, 275(5306), 1593-1599.