Condicionamento do operador
O condicionamento operante é uma forma de aprendizagem. Nele, um indivíduo muda seu comportamento por causa das conseqüências (resultados) do comportamento.
A pessoa ou o animal aprende que seu comportamento tem uma conseqüência. Essa conseqüência pode ser
- Reforço: um evento positivo ou gratificante. Isto faz com que o comportamento ocorra com mais freqüência
- Punição: um evento negativo ou punitivo. Isto faz com que o comportamento ocorra com menos freqüência.
- Extinção: nenhum evento se segue, portanto o comportamento não tem conseqüências. Quando um comportamento não tem conseqüências, ele ocorrerá com menos freqüência.
Existem quatro contextos diferentes no condicionamento operante. Aqui, os termos "positivo" e "negativo" não são usados em seu sentido básico; positivo significa que algo é acrescentado, e negativo significa que algo é tirado:
- O reforço positivo (muitas vezes apenas "reforço") ocorre quando há uma recompensa por uma forma de comportamento. Isto aumentará a freqüência com que o comportamento ocorre. Na experiência da caixa Skinner, a recompensa é na forma de alimento quando o rato pressiona uma alavanca.
- O reforço negativo (às vezes "fuga") ocorre quando um estímulo aversivo é removido. Isto aumentará a freqüência na qual o comportamento ocorre. Na experiência da caixa Skinner, houve um ruído alto, que foi removido quando o rato pressionou a alavanca.
- A punição positiva ocorre quando um estímulo é adicionado, o que resulta em um comportamento que ocorre com menos freqüência. Exemplos de estímulos podem ser ruído alto, choque elétrico (rato), ou uma surra (criança).
- A punição negativa ocorre quando um estímulo é retirado, o que faz com que o comportamento ocorra com menos freqüência. Um exemplo pode ser o brinquedo de uma criança tirado depois que a criança faz um comportamento indesejável.
A idéia do condicionamento operante foi primeiramente descoberta por Edward Thorndike, e analisada por B.F. Skinner.
O condicionamento operante é diferente do condicionamento clássico de Pavlov. O condicionamento operante lida com a modificação voluntária do comportamento; o condicionamento clássico com o treinamento de um reflexo.
A lei de efeito de Thorndike
O condicionamento operante, às vezes chamado de aprendizagem instrumental, foi estudado pela primeira vez por Edward L. Thorndike (1874-1949). Ele observou o comportamento de gatos tentando escapar de caixas de quebra-cabeças feitas em casa. Quando foram colocados nas caixas pela primeira vez, os gatos demoraram muito tempo para escapar. Com a experiência, respostas bem sucedidas ocorreram com mais freqüência, permitindo que os gatos escapassem em menos tempo. Em sua lei de efeito, Thorndike teorizou que os comportamentos seguidos por conseqüências satisfatórias tendem a se repetir, e aqueles que produzem conseqüências desagradáveis são menos propensos a se repetirem. Em resumo, algumas conseqüências reforçaram o comportamento e algumas conseqüências enfraqueceram o comportamento. Thorndike produziu as primeiras curvas de aprendizado conhecidas por este procedimento.
B.F. Skinner (1904-1990) elaborou uma análise mais detalhada do condicionamento operante. Skinner inventou a câmara de condicionamento operante que lhe permitia medir a taxa de resposta como uma variável chave dependente. Ele usou um registro de prensas de alavanca ou bicos de chave.
Princípios do condicionamento operante:
- Discriminação, generalização e a importância do contexto.
- O aprendizado se dá em contextos.
- A maioria dos comportamentos está sob controle de estímulos: uma resposta particular só ocorre quando um estímulo apropriado está presente.
- O controle dos estímulos é eficaz mesmo que o estímulo não tenha significado para o respondente.
- Extinção: o comportamento operante sofre extinção quando o reforço pára.
- Os reforços só ocorrem quando a resposta adequada foi feita, e podem não ocorrer mesmo assim. Os comportamentos não se enfraquecem e se extinguem por causa disso.
- Os resultados dependem em parte da freqüência com que os reforços são recebidos.
- Cronogramas de reforço: o cronograma dos reforços é crucial.
- Programação de intervalos fixos: os reforços são apresentados em períodos de tempo fixos, desde que seja feita a resposta apropriada.
- Cronograma de intervalos variáveis: um comportamento é reforçado com base em um tempo médio que expirou desde o último reforço. Cronogramas de proporção: com base na proporção de respostas aos reforços.
- Cronograma de intervalos fixos: o reforço é entregue depois que um número específico de respostas foi feito. O caso especial de apresentação de reforço após cada resposta é chamado de reforço contínuo.
- Programação de intervalos variáveis: o reforço da entrega é baseado em um número médio específico de respostas.
Perguntas e Respostas
P: O que é condicionamento operante?
R: Condicionamento operante é uma forma de aprendizagem na qual um indivíduo muda seu comportamento devido às conseqüências (resultados) do comportamento.
P: Quais são os quatro contextos do condicionamento operante?
R: Os quatro contextos de condicionamento operante são reforço positivo, reforço negativo, punição positiva e punição negativa.
P: Como funciona o reforço positivo?
R: O reforço positivo ocorre quando há uma recompensa por uma forma de comportamento, o que aumentará a freqüência com que o comportamento ocorre.
P: Como funciona o reforço negativo?
R: O reforço negativo ocorre quando um estímulo aversivo é removido, o que aumentará a freqüência com que o comportamento ocorre.
P: Como funciona a punição positiva?
R: A punição positiva ocorre quando um estímulo é adicionado, o que faz com que o comportamento ocorra com menos freqüência.
P: Como funciona a punição negativa? R: A punição negativa ocorre quando um estímulo é tirado, o que faz com que o comportamento ocorra com menos freqüência.
P: Quem descobriu primeiro o condicionamento operante?
R: Edward Thorndike descobriu primeiro o condicionamento operante e depois foi analisado por B. F. Skinner.