신속하고 확실한 처벌 자극은 원하지 않는 행동을 강력하게 감소시킬 수 있다. 금지된 사물을 건드린 쥐가 전기 자극을 받으면 그 행동을 멈추고, 어린아이가 뜨거운 난로를 만져서 손을 데면 아이는 더 이상 난로를 만지는 행동을 하지 않는다. 질책이나 타임아웃 처벌을 받은 아이는 바로 더 이상 처벌받은 행동을 하지 않는다. 충동적으로 저지르는 범죄 행동의 경우 중형의 위협보다는 신속하고 확실한 처벌 자극이 더 효과적으로 그 행동을 줄인다는 연구도 있다. 강화와 처벌의 형태는 부모가 자녀를 교육할 때 나타난다. 자녀가 거짓말을 하면 부모는 야단을 치는데, 이는 거짓말하는 행동을 줄이려는 처벌이 된다. 동생이 공부하는 것을 도와주면 칭찬을 받는데, 칭찬받는 것은 도와주는 행동을 증가시키는 강화가 된다. 그러나 많은 심리학자가 양육과 관련한 처벌에 큰 문제점이 있음을 지적한다. 처벌은 학습에 일반적으로 강화보다 덜 효과적이라고 하는데, 그 이유는 여러 가지가 있으나 처벌은 대체 행동을 제시하지 않기 때문에 학습에 효과적이지 않다고 알려져 있다. 한편 처벌은 공포를 가르칠 수 있다. 처벌받은 아동은 공포를 바람직하지 않은 행동뿐만 아니라 처벌을 가한 사람이나 처벌을 받은 장소와도 연합할 수 있다. 즉 아동은 학교에서 선생님에게 처벌받으면 선생님에 대한 공포를 학습하여 학교를 기피하거나 더 불안해질 수 있다. 또한 처벌은 문제에 대처하는 방법으로 공격을 시범 보임으로써 공격성을 증가시킬 수 있다. 연구 결과는 처벌받은 이동이 공격성이 높아지고 저하된 자존감을 보일 가능성이 큼을 보여준다. 공격적이며 학대하는 부모들이 학대하는 가정 출신인 경우가 많다. 어떤 연구자들은 상관관계 연구의 문제점을 지적한다. 처벌받은 아동들이 더 공격적일 수 있다. 그러나 이것은 심리치료를 받아온 사람이 우울증으로 고생할 가능성이 더 높은 것과 마찬가지이다. 이들은 이미 치료받아야 할 만큼 문제를 가지고 있다. 이미 가지고 있는 반사회적 행동에 적응하고 있다면 문제행동을 보이는 아동에게 한두 번 가하는 처벌은 효과적일 수도 있지만, 처벌이 효과적이라면 처벌을 강화와 연결하는 것이 필요하다. 또 다른 연구자들은 과거의 잘못된 행동을 통제하더라도 어린 아동에게 처벌을 자주 하는 것이 미래의 공격성을 예측한다는 사실을 보여주었다. 처벌은 하지 않아야 할 것을 알려주지만, 강화는 해야 할 것을 알려준다. 스키너의 표현에 따르면, 처벌이 가르쳐 주는 것은 그 처벌을 회피하는 방법이다. 오늘날 대부분의 심리학자는 강화를 선호한다. 올바르게 행동하는 것에 주목하고 그것을 칭찬하는 것이 중요하다. 변별, 일반화, 소멸 조작적 조건형성의 기본 구조는 강화와 처벌이 행동을 변화시킨다는 것이다. 이런 기본 구조 외에도 조작적 조건형성을 이루는 요인들이 여러 가지 있다. 고전적 조건형성과 마찬가지로 변별, 일반화, 그리고 소멸 등이 그 중요한 요인이다. 어떠한 강화 자극들은 아주 작은 차이로도 학습자가 구별된 강화 자극으로 이용하도록 만들 수 있다. 예를 들어 비둘기를 대상으로 한 실험에서 변별 자극으로 피카소의 그림과 모네의 그림이 구별되는 강화 자극이 될 수 있었다. 건반 쪼기를 한 이 실험에서 비둘기는 피카소의 그림을 강화 자극으로 훈련받은 경우 다른 입체파 그림에도 반응했으나, 모네의 그림에는 반응하지 않았다. 고전적 조건형성과 마찬가지로 조작적 조건형성이 된 행동도 소멸할 수 있다. 비둘기는 건반을 쪼는 행동으로 먹이를 받을 수 있다는 것을 학습하면 건반을 포는 행동을 되풀이하지만, 건반을 쪼아도 먹이를 주지 않으면 그 행동은 얼마 안 가 사라진다. 조작적 조건형성을 통해 학습된 행동의 소멸은 고전적 조건형성의 학습보다 좀 더 복잡한데, 그 이유는 강화를 통해 학습된 학습 구조 때문이다. 쥐가 스키너 상자에서 레버를 누르면 먹이가 나오는 것을 학습하는 경우를 가정해 보자. 스키너는 레버를 누를 때마다 먹이를 주는 대신 간헐적으로 먹이를 주거나 레버를 누르는 빈도에 맞추어 먹이를 주는 등 강화 계획에 따른 반응을 연구했다. 그는 학습 횟수만이 중요한 고전적 조건형성과 달리, 조작적 조건형성에는 강화가 나타나는 패턴이 학습에 결정적인 영향을 미친다는 것을 발견했다. 만약 레버를 누를 때마다 먹이 가 나오지 않고 서너 번 눌러야 먹이가 나온다면, 학습하는 데 더 오래 걸릴지는 몰라도 일단 학습된 과제는 소멸이 잘되지 않는다. 레버를 눌러도 먹이가 나오지 않는다면 쥐는 레버와 먹이라는 연합이 없어진 건지, 아니면 레버를 더 눌러야 먹이가 나오는지 할 수 없기 때문에, 먹이가 주어지지 않더라도 한동안 레버를 누르는 행동을 되풀이된다. 여러 가지 강화 계획은 조작적 조건형성에 학습의 속도와 지속성에서 차이를 받을 수 있다. 먼저 고정 간격 계획은 적절한 반응이 있다면 고정된 시간 간격을 주고 강화를 제공하는 스케줄을 말한다. 예를 들어 5분마다 먹이를 주는 강화 간격에서 스키너 상자의 비둘기는 강화 제공 직후에는 거의 반응하지 않았다가, 5분 간격이 끝날 무렵에 갑자기 많은 반응을 보였다. 즉 비둘기가 강화를 받을 시기를 예상하고 그때 맞추어 행동했다. 일상생활에서 고정 간격으로 강화를 받는 경우가 많이 있다. 직장에 나오는 것에 상관없이 일정한 날짜에 월급이 나온다면 사람들은 월급날이 가까워질 때만 직장에 나오게 될 것이다. 변동 간격 계획에서 행동은 그 직전의 강화 이후 지나간 평균 시간에 기초하여 강화된다. 5분 변동 간격 계획에서 강화하려는 특정 반응은 평균적으로 5분마다 강화된다. 비둘기는 평균 5분마다 먹이를 받는 정확한 간격은 변하게 된다. 그러한 강화 간격을 주면 비둘기는 꾸준하고 일관성 있는 반응을 보이게 되는데, 이는 다음 강화까지의 시간을 평균적으로 예측할 수 있기 때문이다. 고정 비율 계획에서 강화는 특정한 수의 반응이 만들어진 다음에 제공된다. 실생활에서 고정 비율 계획의 예가 많이 있다. 예를 들어 성과급 노동자는 일정 한 수의 제품을 만든 후 임금을 반기 때문에 원칙적으로 다음 강화가 언제 울지 정확하게 예측할 수 있다. 고정 비율의 강화 계획은 효과적일 수 있지만, 사람들이 강화를 정확하게 예측할 수 있기 때문에 강화가 끊어지면 학습은 쉽게 소멸할 수 있다. 변동 비율 계획에서 강화의 제공은 반응의 특정한 평균 수에 근거를 둔다. 예를 들어 카지노의 슬롯머신은 번동 비율 계획에 따라 지급되는데, 100명에 한 번 이긴다고 광고할 수 있으며 이것이 사실일 수도 있다. 그러나 강화를 얻기 위한 반응의 비율이 변하기 때문에, 아무리 오래 카지노에서 슬롯머신을 해도 당첨이 되지 않을 수 있다. 변동 비율 계획으로 강화를 받을 경우 특히 학습을 소멸시키기 어렵다. 이것이 도박에 중독된 사람들이 쉽게 도박을 끊지 못하는 이유 중 하나이다. 간헐적 강화는 반응 중 일부만 강화를 주는 것을 말한다. 간헐적 강화로 유지되는 조작 행동은 연속 강화로 유지되는 조작 행동보다 잘 소멸하지 않는다. 동물에 대한 강화 계획이 불규칙하고 간헐적인 경우 한동안 강화를 받지 못해도 실제로 강화가 사라진 것인지 알기가 더 어려워진다.
'심리학' 카테고리의 다른 글
관찰학습 (0) | 2025.01.13 |
---|---|
조작적 조건형성에 영향을 미치는 요인 (0) | 2025.01.13 |
조작적 조건형성-강화와 처벌 (0) | 2025.01.12 |
공포증과 중독에 미치는 학습의 영향 (0) | 2025.01.12 |
고전적 조건형성 (0) | 2025.01.11 |