통찰학습 외 :: 생각한대로
반응형




강의를 듣고 경험에 대한 이야기입니다.

오늘은 심리학의 이해, '학습' 두 번째 시간입니다.


조작적 조건형성

조작적 조건 형성에서 행동과 자극을 짝을 지었었다. 그리고 그 자극을 보상 또는 강화물이라고 했다. 어떤 행동이 이루어진 뒤에 보상이나 강화물이 없다면 그러한 행동은 더 이상 나타나지 않을 것이므로 조작적 조건 형성에서 강화는 매우 중요한 요소이다.

강화란 어떤 자극을 제공하거나 제거함으로써 어떤 행동을 하게 할 확률을 증가시키는 과정을 말한다. 그래서 어떤 대상 메게 새로운 행동을 하게 하기 위해서는 그 대상이 행동하고 난 뒤에 반드시 강화물을 줘야 한다는 것이다.

 

심리학을 만나 행복해졌다:복잡한 세상과 사람의 마음을 꿰뚫어 보는 심리법칙 75

COUPANG

www.coupang.com

 

강화의 유형

강화 유형에는 긍정적 강화와 부정적 강화가 있다.

긍정적 강화란 어떤 행동에 뒤따라서 제시될 때 그 행동을 더욱 강화시키는 것이다. 예로, 칭찬, 돈, 음식, 학점, 승진 등이 있다.

부정적 강화란 행동에 뒤따라서 제거될 때 그 행동의 가능성이 증가된다는 것이다. 예로, 전기쇼크, 소음, 두통약, 고통 등이 있다.

※체벌이나 처벌은 뒤따라서 제시나 제거함으로써 그 행동의 가능성을 증가시키는 것이 아니라 행동의 가능성을 낮춰 주는 것이므로 부정적 강화에 해당되지 않는다.

강화는 또 성격에 따라 1차 강화와 2차 강화로 구분된다.
1차 강화란 그 사람의 생명유지와 직접적으로 관련이 있는 것을 말한다. 예로, 음식, 산소, 물 등이 있다.
2차 강화란 다른 말로 사회적 강화라고도 하며, 그것 자체는 의미가 없으나 사회적으로 의미가 있는 것이다. 예로, 돈이 그것이다.

강화는 강화물을 주는 방법에 따라 전체 강화와 부분 강화로 나뉜다.

잔체강화는 특정한 행동이 일어날 때마다 강화물이 주어지는 것이다.

부분강화는 말 그대로 특정한 행동이 일어나더라도, 줄 때도 있고 안 줄 때도 있는 것을 말한다.

전체 강화는 학습은 빠르게 일어나지만 소거도 빠르다. 하지만 부분 강화는 학습은 상당히 느리나 소거도 느리다.

 전체강화의 예로 커피자판기가 있다. 동전 넣을 때마다 커피가 나온다. 그리고 빨리 소거된다.

부분 강화의 예로 고스톱이 있다. 항상 따지는 않으므로 부분강화에 해당한다. 고스톱은 학습은 느리지만 소거는 아주 늦게 되는 것으로 부분강화의 특징을 가지고 있다.

부분 강화에는 행동이 일어날 때마다 강화물을 주는 것이 아니므로 강화물을 주는 방법에 따라 4가지의 강화 일정으로 나뉜다.

거기에는 고정 간격, 변동 간격, 고정비율, 변동비율이 그것이다.

고정 간격은 말 그대로 강화물을 주는 시간이 일정한 것을 말한다. 대표적인 것이 월급이다.

변동 간격은 강화물을 주는 시간이 일정하지 않은 것이다. 예로, 용돈 같은 것이 있다.

고정비율은 강화물의 비율을 말하는 것으로 그 비율이 일정하게 묶여 있는 것이다.

변동비율은 말 그대로 강화물의 비율이 일정하지 않은 것이다.

네 가지 강화 일정은 각각 독특한 행동양식을 만든다. 예를 들어 학생들의 시험의 경우 기말고사 등 정해놓은 기간이 있으므로 평소에는 공부를 대충하다가 시험 시간에 근접할 때마다 집중하여 많이 하는 것으로 나타난다. 즉 고정간격형태의 강화일정은 학습성과가 꾸준히 나타나지 않는다. 고정 간격의 단점이라고 볼 수도 있다.

반면에 변동 간격의 경우 수시로 언제든지 시험을 본다고 하면 학습성과가 꾸준히 상승한다고 한다.

고정비율의 경우 특정 비율을 달성할 때 강화물을 제공하는데 예를 들어 치킨집이나 피자집에서 쿠폰 열 장을 모으면 하나를 공짜로 제공하는 경우가 그것이다. 이 강화 일정의 특징은 행동이 처음에는 적었다가 목표량에 근접할수록 더 빠르게 증가하다가 강화물을 받은 후에는 일정기간 휴식을 갖다가 어느 정도 선에 오면 다시 행동 성과가 빠르게 증가하는 패턴을 반복하는 양상을 보인다.

변동비율은 잘만 하면 지속적으로 강화물을 받을 수도 있지만 못 받을 수도 있다. 그래서 사람들은 지속적으로 강화물을 받으려고 노력하지만 여의치 않은 경우가 많다. 대표적인 예로 도박을 들 수 있다. 강화물이 언제 주어질지 모르기 때문에 지속적으로 행동을 하게 되지만 이러한 행동으로부터 벗어나기 또한 힘이 드는 것이 특징이다.

변동비율이 학습능률을 끌어올리는 데는 가장 좋은 방법이긴 하나 학습자가 황폐해지고 탈진될 우려가 있어 사회적으로 적용시키기는 바람직한 방법이라고 볼 수 없다.

이 중에서 가장 효과적이면서도 적용 가능한 방법은 변동 간격과 고정비율이 될 것이다.



행동 조성

조작적 조건 형성에서 강화와 함께 중요한 것이 하나 더 있다면 그것은 바로 '행동 조성(Shaping)이다.

Shaping, 즉 '행동 조성'이란 어떤 목표가 있을 때 그 목표에 도달하기 위해 과정을 여러 단계로 잘게 쪼갠 후, 각 단계를 이룰 때마다 강화물을 주는 것이다. 각 단계마다 바람직한 행동에는 강화물을 주고 바람직하지 않은 행동에는 처벌을 하여 최종적으로는 목표에 도달하려는 것을 '행동 조성'이라 한다.

예를 들어, 사자가 불을 타고 있는 불원을 뛰어넘는 서커스를 보이기 위해 훈련한다고 해 보자. 최종목표는 바로 사자가 불타는 원을 뛰어 넘는 것이다. 그전에 불을 뛰어넘을 수 있는 동물은 지구 상에 인간밖에 없다고 한다. 본래 동물들은 불을 보면 뒤로 돌아간다고 한다.
그러므로 사자가 불타는 원을 뛰어넘는 것은 정말 무수히 많은 훈련의 결과임을 알 수 있다.

불타는 원을 뛰어넘기 위해 동작을 단계별로 나눈다면, 1) 먼저 불을 보고 도망가지 않고 정면을 응시한다. 이때 강화물을 준다. 2) 뛸 준비를 한다. 이때 또 강화물을 준다. 3) 뛴다. 이때 강화물을 준다. 4) 불타는 원을 비껴간다. 이땐 처벌을 한다. 5) 불타는 원을 넘는다. 이때 강화물을 준다. 이런 식으로 최종 목표 달성을 위한 바람직한 행동에는 강화물을, 그렇지 않은 행동에는 처벌을 주며 최종 목표에 도달하게 된다.


조건 형성의 성립요건

고전적 조건 형성, 즉 Classical Conditioning에서는 조건적 자극과 무조건적 자극이 결합하여 형성된다. 이것이 성립되기 위한 조건은 조건적 자극이 무조건적 자극을 예견할 수 있을 때에만 성립한다.

조작적 조건 형성, 즉 Operant Conditioning에서는 행동과 자극이 결합하여 형성된다. 이때 성립 조건은 행동이 통제성이 있을 때에만 성립한다.

예를 들자면, 개 1과 개 2가 있다고 치자. 이 경우 실험실 A에 전기충격기 바튼이 있어 누르면 A와 B 두 개 실험실 모두의 전기충격이 사라지는데, 실험실 B에는 버튼이 없다. 이때 실험실 A의 개 1은 코로 버튼을 눌러 본다. 전기충격이 없어진다. 다시 버튼을 안 누른다. 충격이 다시 가해진다. 다시 누른다. 이런 시행착오를 거쳐 개1은 버튼을 누르면 전기충격에서 벗어 날 수 있다는 것을 학습한다. 그리고 저기가 전기 총격에서 벗어난 것은 자기가 코로 직접 버튼을 눌렀기 때문이란 걸 알고 있다. 반면 B실험실에 있는 개 2는 전기충격에서 벗어나기 위해 한 것이 아무것도 없고 전기 충격에서 사라진 이유도 전혀 모른다. 그저 개 1한테 의존한 것뿐이다.

그런 상황에서 또 다른 실험실 2로 데리고 간다. 칸막이가 돼 있는 두 개의 방이다. 방 A에는 전기충격기를 설치하고, 방B에는 전기충격기를 설치하지 않았다. 앞의 개 1을 전기충격기가 있는 방 A에 집어넣는다. 그랬더니 개 1은 바로 칸막이를 뛰어넘어 방B로 가서 편안하게 쉰다. 그런데 개 2를 전기충격기가 있는 방A에 집어넣었더니 그대로 전기충격을 견디며 있었다.

이 실험에서 알 수 있는 것은 개 1은 바로 직전의 전기충격기 실험에서 이미 통제성을 획득했기 때문에 칸막이를 바로 뛰어넘을 수 있었고, 개 2는직전의 실험에서 자신이 한 일이 아무것도 없었고 동시에 통제성도 획득하지 못했으므로 칸막이를 뛰어 넘을 생각을 못한 것이다.

결국, 조작적 조건 형성에서 행동과 무조건적 자극이 결합하여 효과를 나타내기 위해서는 통제성이 필수조건이다.

또 하나의 예로 시험을 봤는데, 시험을 잘 본 것이 내가 노력해서 잘 본 것은 내가 통제성을 가지고 있는 것이고, 운이 좋았다거나, 친구의 도움이 있었다거나 나의 내가 직접 노력하고 통제한 것이 원인이 아니면 다음 시험에서 또 잘 볼 확률이 떨어진다는 것이다.

정리하면 조작적 조건 형성은 행동자가 통제성을 가질 때에만 조건형성이 성립한다는 것이다. 고전적 조건형성은 조건적 자극이 무조건 적 자극에 대한 예견성을 가질 때에만 성립하고, 조작적 조건형성은 행동자가 그 행동에 대해 통제성을 가질 때에만 성립한다.

한편 조작적 조건 형성에서 성공을 못하고 실패했을 경우는 통제성을 가지고 내가 잘못해서 실패했다고 하는 것만이 능사가 아니다. 왜냐하면 자칫 잘 못하면 자기 패배감이나 무기력감이 올 수 있고 심하면 우울증에 빠질 수도 있다. 그래서 좀 아이러니한 일이지만 잘되면 내 탓, 잘못되면 조상 탓하는 우리 선조들이 심리학의 정신세계에 대한 통찰력이 있지 않았나 하는 대목이다.ㅎ.



인지학습

인지학습은 학습자가 하는 행동이 눈에 보이지 않는다. 바로 이 학습방법은 머릿속에서만 학습이 이루어지기 때문이다. 이 학습에는 세 가지 종류가 있다. 잠재 학습, 통찰학습, 사회학습이 그것이다.


잠재학습

잠재 학습을 연구한 사람은 톨만(Tolman)으로 그는 다음과 같은 실험을 한다.

열십자로가 있다. 그 십자로의 남과 북에 각각 출구가 있고, 동쪽 끝에 먹이가 놓여 있다. 남쪽 출구에 쥐를 집어넣었다. 그랬더니 먹이를 찾아 여기저기 막 다니다가 결국은 동쪽에 있는 먹이를 찾게 되었고 또 몇 번을 다니다가 또 먹이를 찾고 하다가 불필요한 과정을 생략하고 직진과 우회전을 하여 바로 먹이 있는 곳으로 가서 먹이를 먹기 시작한다. 이제 먹이를 먹기 위해서는 직진과 우회전이라는 학습을 한 것이다.

톨만은 이 쥐를 다시 출구를 바꿔 북쪽으로 집어넣어 보았다. 스키너의 연구대로라면 이 쥐는 먹이를 찾기 위해 직진하고 우회전하여 서쪽으로 가야 맞다. 그런데 이게 어찌 된 일인가? 직진과 우회전하여 서쪽으로 갈 것으로 예측했던 쥐가 직진과 좌회전을 하여 먹이를 바로 찾아내지 않는가? 톨만은 알았다. 쥐가 직진과 우회전을 학습한 게 아니라, 헤집고 다니는 동안 십자로의 상황지도를 머릿속에 넣게 된 것이다. 이제 어디에 갔다 놓아도 먹이 있는 곳을 찾을 수가 있는 것이다. 이것을 톨만은 잠재 학습이라고 했다. 톨만은 스키너의 행동 학습이론(스키너 박스)로는 설명할 수 없는 새로운 진일보한 인지학습인 잠재 학습이론을 발견해 낸 것이다.

스키너와 톨만은 같은 하버드대학교에서 심리학 교수를 했었다고 한다. 스카너는 행동심리학을 가르쳤고, 톨만은 행동심리학을 가르쳤었다고 한다. 그 당시 행동 심리학이 한참 붐이 일고 있었던 시기라서 스키너의 행동심리학은 수강신청자가 매 학기마다 넘쳐 흘렀던데 비해 톨만의 잠재 심리학 수강생은 한 명도 없자, 톨만은 결국 하버드대학교에서 쫓겨나게 된다.

그런데 그 인지심리학이 1960 년대에 외서 우수한 이론으로 재조명을 받게 되고 톨만의 잠재 학습이론이 부활하게 된다. 그가 만든 심리학이 세월이 지나 제대로 인정받기에 이르렀는데, 그는 30:대에 요절하고 세상에는 이미 없다. 몇십 년을 앞선 이론을 내놓은 심리학자가 홀대를 받고 하버드대학교에서 쫓겨난 것이다. 시대를 잘못 타고난 것이라고 말할 수밖에 없다.


통찰 학습

퀠러(K"oller )라는 심리학자에 의해 연구된 것으로 원숭이에 대한 실험을 한다.

우리 안에 나무 막대기들이 한쪽 귀퉁이에 흩어져 있는데 원숭이를 우리 안에 넣고, 우리 밖에는 바나나를 놓아두었다. 원숭이는 바나나를 보고 먹고 싶어 이리 뛰고 저리 뛰면서 발을 뻗어 보기도 하고 온갖 행동을 다했으나 방법을 못 찼았다. 한쪽 구섞에 웅크리고 앉아 머리를 쥐어짜며 생각에 잠긴다. 그러다가 불현듯 뭔가 생각이 난 듯 갑자기 벌떡 일어서더니 나무 작대기를 집어 든다. 그리고 그 작대기로 바나나를 끌어들여 마침내 바나나를 손에 넣는다.

통찰은 세 가지의 특성을 가지고 있다고 한다. 통찰은 갑작스럽게 떠오르는 특성이 있고, 다른 상황으로 전이가 가능하고, 재사용이 가능하다는 것이다.

퀠러는 한 번의 통찰력을 경험한 원숭이를 다시 두 번째 실험실로 옮긴다. 이 실험실은 천장에다 바나나를 매달아 놓고, 바닥에는 박스들을 넣어 놓았다. 물론 원숭이도 이 실험실 안에 넣어 놓고 관찰했다. 이 원숭이는 서슴지 않고 박스를 착척 쌓아 놓고 올라서서 유유히 바나나를 따 먹고 내려왔다.

원숭이가 두 번째 실험에서 이렇게 쉽게 바나나를 따낸 것은 이 원숭이가 이전 실험에서 먼저 통찰력을 얻었기 때문에 가능했다는 것이다. 이 과정을 겪지 않은 원숭이라면 불가능했을 것이다.

첫 실험에서 이 원숭이는 우리 밖의 바나나를 갖고 올 방법을 몰라 쪼그리고 앉아 깊이 생각하던 중 갑자기 통찰력(Insight)이 떠 올랐다고 하여 통찰 학습이라 했다.

다시 말해 원숭이가 쪼그리고 앉아 샘 각한 것은 바로 정신적 시행착오였던 셈이다.

이 통찰 학습을 다른 말로 "Ah학습"이라고도 한다. 쉽게 머리에 떠오르지 않아 머리를 쥐어짜듯 곰곰이 생각하다가 생각이 떠오르면 우리는 "아"하고 탄성을 지른다 하여 붙여진 이름 이리고 한다.


사회학습

이 학습이론은 "반두라(Vandura)"라는 사회 심리학자가 제안한 것이다. 이전의 고전적 조건 형성, 조작적 조건 형성, 잠재 학습, 토찰 학습은 문제를 해결하기 위해 남의 도움 없이 행동자가 직접 문제를 풀었다.

학습을 하는 데 있어 직접 경험으로 하는 방법과 간접경험으로 하는 방법이 있다. 직접 경험에 의해 학습을 하려면 아주 오래 걸린다. 하지만 간접경험을 통해 학습을 하게 되면 짧은 시간에 많은 것을 배울 수 있다.

또 세상을 살아가면서 직접적으로 경험을 하여 얻는 것보다 간접경험을 통해 얻는 것이 더 많다. 즉 사회 속에서 학습이 이루어진다고 본 것이다.

반두라는 사회학습을 하는데 관찰, 모방. 대리가 필요하다고 했다. 관찰은 말 그대로 상대방의 행동을 유심히 바라보는 것이다. 그다음에 모방, 즉 따라서 해 보는 것이다. 어린이가 어른 흉내를 내는 것 등이 이 예이다. 그리고 대리는 다른 사람에게 일어나는 일에 나도 동화되는 것이다. 이를테면 어느 조직에서 동료가 직장상사로부터 야단을 맞고 있으면 주변 사람들 조차 조용히 침묵을 유지한다. 또 드라마나 영화에서 수술 장면이 나오면 얼굴을 찡그린다. 즉, 주변에서 일어나는 일을 내 일처럼 생각하고 느끼는 것이다.

사회학습에는 네 가지 과정이 있다. 주의 과정, 파기 과정, 재생과정, 동기화 과정이 그것이다. 이 과정을 거치며 사회학습을 배워 나간다. 이 속에는 관찰, 모방, 대리가 포함된다.

주의 과정은 관찰이다. 즉 자기에게 영향력을 행사하는 사람들(부모 또는 좋아하는 배우)을 관찰한다. 그다음에 그것을 기억 속에 집어넣는다. (파기), 내가 한번 재생해 본다(재생: 실제와 상상 두 가지이다), 마지막의 동기화는 강화를 뜻한다. 이러한 네 가지 과정을 통해서 사회학습을 하게 된다는 이야기다.

오늘은 여기까지 하겠습니다. 긴 글 읽어주셨다면 감사드립니다. 내일 좋은 하루 보내시길 바랍니다.



Mansur


 

반응형

'생활 > 강의리뷰' 카테고리의 다른 글

부호화 장기 기억  (0) 2020.06.16
부호화 기억  (0) 2020.06.15
조작적 조건형성 학습  (0) 2020.06.13
운동지각  (0) 2020.06.12
감각 vs 지각  (0) 2020.06.12

+ Recent posts