본문 바로가기
심리학

조작적 조건형성-강화와 처벌

by sophi-space 2025. 1. 12.

손다이크의 연구에서는 동물의 행동이 그다음에 일어날 일들을 결정한다. 고양이가 레버를 누르면 상자의 문이 열리지만, 다른 행동을 하면 문이 열리지 않는다. 수족관에서 돌고래가 공중으로 점프해서 몸을 비틀고 다시 입수해서 재주넘기는 하고 다시 후프 속으로 점프하는 것을 어떻게 배울 수 있었을까? 단순한 자극-반응으로의 행동의 관계로는 대부분의 행동을 설명할 수 없다. 우리의 행동들은 조성의 결과이며, 이것은 최종 희망하는 행동으로 이르는 연속 단계에 대한 강화로부터 생기는 학습이다. 한 세트 행동의 결과가 다음 행동을 조성하고, 그 세트의 결과가 다음 행동을 조성하는 식으로 진행된다. 배고픈 쥐에게 레버를 누르도록 조건 형성시키는 것을 가정해 보자. 우선 쥐가 자연 상태에서 어떻게 행동하는지 관찰한 후에, 기존 행동에 근거하여 새로운 행동을 만들도록 해야 한다. 쥐가 레버에 접근할 때마다 먹이 보상을 준다. 쥐가 규칙적으로 레버에 접근하면 보상을 위해서는 더 가까이 가도록 요구하고, 최종적으로 먹이를 얻기 위해서는 레버를 앞발로 건드릴 것을 요구한다. 이러한 계기적 근사법을 사용함으로써 다른 모든 반응을 무시하고 최종적으로 원하는 행동에 가까운 행동에만 보상을 준다. 이런 방법으로 점진적으로 복잡한 행동을 만들어 갈 수 있다. 강화와 처벌 학습 연구에 대한 스키너의 접근은 강화와 처벌에 초점을 두었다. 강화는 그로 인해 행동이 더 많이 발생하게 되는 자극이나 사건을 말하며 처벌은 어떤 행동을 감소시킬 수 있는 자극이나 사건을 말한다. 특정한 자극이 강화물로 또는 처벌로 작용하는지 여부는 그 목표하는 행동을 중진 시킬 수 있는지 감소시킬 수 있는지에 달려있다. 예를 들어 음식을 제공하는 것은 동물의 어떠한 행동을 증진할 수 있고, 음식을 제거하는 것은 그 행동을 감소시킬 수 있다. 운전자에게 과속 범칙금을 부과하는 것은 속도위반을 감소시킬 수 있다. 스키너는 강화를 정적 강화와 부적 강화로 구분하였다. 자극이 제시되는 것이 행동을 증가시키면 정적 강화가 되고, 자극을 제거하는 것이 행동을 증가시키면 부적 강화가 된다. 여기서 부적 강화는 처벌이 아니다. 부적 강화는 없어졌을 때 그로 인해 안도감을 줄 수 있는 경우로 생각할 수 있다. 예컨대 칭얼거리는 아동, 두통, 귀찮은 알람 소리 등이 부적 강화될 수 있다. 통증을 가라앉히기 위해서 진통제를 복용하는 것, 안전벨트를 착용하여 자동차 경고음을 제거하는 것 등이 부적 강화의 사례이다. 때때로 부적 강화와 정적 강화가 동시에 발생할 수 있다. 공부하지 않고 놀다가 시험을 망치고 걱정이 태산인 학생이 다음 시험을 위해 열심히 공부하는 경우를 생각해 보자. 이 학생은 공부함으로써 불안감이라는 부적 강화를 벗어날 수 있다. 강화물의 종류에는 생물학적 기능을 하는 1차 강화물과 학습된 조건 강화물이 있다. 조건 강화물은 2차 강화물이라고도 불리며, 1차 강화물과의 연합을 통해서 그 위력을 갖게 된다. 스키너 상자에 들어 있는 쥐가 불빛이 비치면 항상 먹이가 주어진다는 사실을 학습한다면 불빛을 켜는 행동을 하게 될 것이다. 음식, 안락한, 따뜻함 등은 1차 강화물이 된다. 우리의 삶은 돈, 좋은 성적, 칭찬 등과 같은 수많은 조건 강화물로 둘러싸여 있으며, 조건 강화물은 기본적인 보상과 연계되어 있다. 한 연구팀은 돈이 조건 강화물이라면, 즉 사람들이 돈을 갈망하는 것이 음식을 갈망하는 것에서 유래된 것이라면, 배고픔이 사람들로 하여금 더 돈을 갈망하게 할 것이라고 추론하였다. 실제로 실험에서 사람들은 먹을 것을 박탈당하였을 때 자선사업에 돈을 기부할 가능성이 작았으며, 배가 고플 때 다른 참가자들과 돈을 공유할 가능성이 줄어들었다. 또한 참가자들은 실험에서 돈을 잃었을 때 배고픔을 더 느낀다고 하였다. 강화의 시기도 조건형성에 영향을 미친다. 쥐에게 레버를 누르도록 조건 형성시키는 실험에서 배고픈 쥐는 실험자가 원하는 대로 행동하기에 앞서 긁기나 냄새 맡기, 아니면 이리저리 돌아다니기 등 일련의 행동하게 된다. 한 가지 행동을 한 후에 즉시 먹이 강화물이 제공되면 그 행동을 재연할 가능성이 증가한다. 쥐가 레버를 눌렸는데도 실험자가 다른 일을 하다가 강화물을 주는 것을 지연한다면 레버 누르기는 강화되지 않는다. 오히려 레버를 누른 후 강화물을 받기 전까지 했던 우발적인 다른 행동들이 강화를 받게 된다. 사람들은 쥐와는 달리 상당히 지연된 강화물에도 반응할 수 있다. 학생들은 한 학기 후에 나오게 될 성적을 위해 열심히 공부하고, 운동선수는 경기에서 좋을 성과를 얻기 위해 꾸준히 훈련한다. 실제로 지연된 큰 보상을 위해서는 즉각적인 작은 보상을 지연시키는 것을 학습해야 한다. 지연된 더 큰 보상을 위해 지금 당장의 충동을 제어하는 능력은 성취에 중요한 역할을 한다. 스탠퍼드 대학 심리학과에서 운영하던 어린이집에서 4세 아동들에게 마시멜로를 주고 더 많은 마시멜로를 위해 당장 먹지 않고 기다릴 수 있는지를 알아보았다. 지연된 보상을 위한 제어 행동을 보기 위한 연구였으나, 실험자들은 지연된 보상을 기다릴 수 있었던 아동들이 기다리지 못한 아동들보다 성장한 후에 사회에서 훨씬 더 큰 성취를 이룬 것을 발견하였다. 우리는 일상생활에서 즉각적인 결과를 원하다가 더 큰 것을 놓치는 경우가 많이 있다. 밤늦게까지 텔레비전을 보다가 그다음 날 활동에 지장을 받기도 하고, 즉각적인 보상을 위한 청소년들의 무방비한 성행동이 인생에 큰 문제를 만들기도 한다. 강화는 행동을 증가시키는 반면, 처벌은 행동을 감소시킨다. 처벌 자극은 어떤 것이든 행동의 빈도를 감소시킨다.

'심리학' 카테고리의 다른 글

조작적 조건형성에 영향을 미치는 요인  (0) 2025.01.13
조작적 조건형성의 강화 간격  (0) 2025.01.12
공포증과 중독에 미치는 학습의 영향  (0) 2025.01.12
고전적 조건형성  (0) 2025.01.11
연합학습  (0) 2025.01.10