Behaviorismo: Do reflexo ao operante

Sob influência do filósofo Bertrand Russell, Skinner já havia escolhido o caminho behaviorista antes mesmo de iniciar seus estudos e pesquisas em psicologia na Universidade de Harvard (Skinner, 1979). A escolha pelo behaviorismo se torna mais evidente, porém, quando o autor (1979, p.4) enumera os primeiros livros que constituíram sua biblioteca da área: “Eu comecei a montar uma biblioteca, iniciando com Philosophy, de Bertrand Russell, Behaviorismo de John B. Watson, e Conditioned Reflexes, de I. P. Pavlov – os livros com os quais pensei preparar‑me para a carreira em psicologia”. Embora Watson seja conhecido como o fundador e principal divulgador do behaviorismo (Wozniak, 1993, 1994), a influência de Pavlov em Skinner parece ser mais categórica (Skinner, 1966/1972e, p.594):

Possivelmente, a lição mais importante, e uma facilmente não notada, que aprendi com [Pavlov] foi o respeito pelo fato. No dia 15 de dezembro de 1911, exatamente às 1:55 da tarde, um cão secretou nove gotas de saliva. Aceitar esse fato seriamente, e fazer com que o leitor o aceitasse seriamente, não foi pouca coisa. Também foi importante que esse foi um fato a respeito de um organismo único. […] Pavlov estava falando do comportamento de um organismo por vez. Ele também enfatizou as condições de controle. O seu laboratório à prova de som, cuja foto apareceu em seu livro, impressionou‑me muito, e o primeiro aparato que construí consistiu numa câmara à prova de som e numa caixa de atividade silenciosa. […] O lema dessa sociedade é tirado de Pavlov: “Observação e observação”. Pavlov queria dizer, certamente, a observação da natureza e não do que alguém escreveu sobre a natureza.

As principais características da concepção de ciência proposta por Skinner já estavam em Pavlov: a importância e atenção aos fatos, mesmo que à primeira vista pareçam insignificantes e mesmo que fujam do planejamento prévio da pesquisa; a importância do estudo com sujeito único, em vez de análises estatísticas com grande amostragem que poderiam mascarar a nuance dos processos comportamentais, dificultando, assim, a análise funcional; a utilização de aparatos para o controle das variáveis independentes; a observação direta da natureza em vez de ater‑se em construtos teóricos que vão além dela.

Evidentemente, na medida em que Pavlov foi uma influência notável para Skinner, nada mais natural que o segundo passasse a estudar o processo pelo qual o primeiro ganhou reconhecimento: o reflexo condicionado. De acordo com Skinner (1931/1961c, 1938/1966a, 1980/1998), o reflexo é uma correlação observada entre um estímulo e uma resposta. O reflexo, portanto, é um processo caracterizado pela relação funcional entre os eventos envolvidos – o estímulo só pode ser caracterizado em função da resposta e a resposta em função do estímulo. Ao analisar a história do reflexo, Skinner (1931/1961c) percebeu que o termo figurava sempre nos estudos fisiológicos.

A própria justificativa da utilização do termo “reflexo” indica a influência da fisiologia, segundo a qual o estímulo causaria um distúrbio no organismo que, por sua vez, passaria pelo sistema nervoso central para, em seguida, ser refletido nos músculos (Skinner, 1938/1966a, 1953/1965). Até mesmo o subtítulo do livro de Pavlov era uma constatação desse fato: “Uma investigação da atividade fisiológica do córtex cerebral” (Skinner, 1966/1972e, p.594). O problema é que, embora afirmasse estudar o sistema nervoso, Pavlov estava na verdade lidando apenas com correlações entre estímulos e respostas.

Portanto, não se estudava o sistema nervoso real (Skinner, 1966/1972, 1975, 1979, 1988); estudava‑se o reflexo e o sistema nervoso aparecia como um aparato conceitual inferido a partir desse processo (Skinner, 1975). Ao constatar esse fato, Skinner percebeu que não era preciso recorrer ao “sistema nervoso conceitual” para estudar o reflexo. Assim conclui o autor (1931/1961c, p.333): “podemos notar […] que a descrição do reflexo em termos funcionais (como a correlação entre o estímulo e a resposta) é sempre precedente à descrição do seu arco”. Sendo assim, o “arco” da fisiologia não é necessário para o estudo da relação funcional. Aliás, a relação funcional é sempre estabelecida antes da postulação do “arco reflexo”.

Essa constatação foi de grande valia porque permitiu a Skinner estudar o comportamento pelos seus “próprios termos”, sem precisar recorrer à fisiologia ou a qualquer outra área de estudo (Skinner, 1931/1961c, 1938/1966a, 1961f, 1979, 1980/1998). Em suas palavras (1947/1961b, p.232‑ ‑233): “O que está surgindo na psicologia […] é uma teoria que se refere aos fatos em um único nível de análise. […] Em nenhum momento a teoria irá criar termos que se refira a um objeto de estudo diferente – a estados mentais, por exemplo, ou a neurônios”. Quais seriam, então, os “termos próprios” ao reflexo condicionado? O experimento de Pavlov com cães tornou‑se o exemplo clássico de reflexo condicionado.

É fato que cães na presença de comida salivam. Em termos específicos, a comida (estímulo incondicionado) elicia a salivação (resposta incondicionada). Suponha‑se, então, que ao apresentarmos a comida ao cão também soemos uma campainha. A relação reflexa “comida → salivação” é incondicionada, o que significa que sua ocorrência independe da história de condicionamento do cão. Não se pode dizer o mesmo da relação “campainha → salivação”. Só após várias apresentações da comida acompanhada pelo estímulo sonoro é que o último também passará a eliciar a resposta de salivação. O processo está simplificado no Quadro 2.2.

Behaviorismo:  Do reflexo ao operante

Na situação 1 temos a relação reflexa incondicionada. Na situação 2 temos a relação incondicionada com a adição do estímulo sonoro que, em princípio, seria neutro nessa relação reflexa.13 A situação 2 também pode representar o próprio processo de condicionamento pelo qual a antes inexistente relação reflexa entre estímulo sonoro e salivação é estabelecida. Em seguida, temos a situação 3, na qual a campainha passa a eliciar a salivação. Embora Skinner (1935/1961h, 1953/1965) tenha sustentado que o condicionamento reflexo é um processo de “substituição de estímulos” no qual um “estímulo previamente neutro adquire o poder de eliciar uma resposta que era originalmente eliciada por outro estímulo” (Skinner, 1953/1965, p.53), tal caracterização é imprecisa.

Primeiro porque a topografia das respostas se modifica em função da natureza do estímulo (Catania, 1999). Talvez essa diferença seja menos visível no caso da salivação, mas, no caso de respostas de flexão de perna eliciadas por estímulos condicionados ou por estímulos incondicionados, as diferenças topográficas são evidentes (Catania, 1999). Mesmo eliciando uma resposta de flexão de perna, é improvável que um estímulo condicionado, como uma campainha, possa produzir resultado idêntico ao do estímulo incondicionado, como um choque elétrico.

O segundo motivo – e talvez o mais importante – que indica a imprecisão na caracterização do condicionamento reflexo como um processo de “substituição de estímulos” está no fato de que o estímulo condicionado não passa propriamente a ter a mesma função que o estímulo in‑ condicionado. Colocando de maneira simples: “no caso clássico de Pavlov, por exemplo, a campainha não substitui a comida (o cão não tenta comer a campainha)” (Catania, 1999, p.213). Qual seria, então, a função do reflexo condicionado? É Skinner (1935/1961h, p.375) quem nos dá a resposta: “ele [o reflexo condicionado] prepara o organismo ao obter a eliciação da resposta antes que o estímulo original tenha começado a agir, e ele faz isso ao deixar qualquer estímulo que tenha incidentalmente acompanhado ou antecipado o estímulo original agir em seu lugar”.

Assim, na relação reflexa condicionada, o estímulo condicionado não substitui o estímulo incondicionado, mas tem a função de preparar o organismo para a sua apresentação: ao eliciar a salivação, a campainha “prepara” o cão para a apresentação da comida e, no caso da flexão de perna, a campainha “prepara” o cão para a apresentação do choque elétrico. A importância da “preparação” se torna evidente quando se avalia o valor seletivo do processo.

De acordo com Skinner (1984, p.219), o respondente condicionado “não tem valor de sobrevivência a não ser que seja seguido pelo incondicionado”. Continuando com o autor (1984, p.219): “Embora alguém possa demonstrar que a salivação é eventualmente eliciada por um sino, não há vantagens para o organismo a menos que seja seguida pela comida”. Na função de estímulo “preparatório”, a capacidade de eliciar a salivação pela campainha antes da apresentação da comida pode tornar o comportamento alimentar mais eficaz, pois o organismo já estaria “preparado” para comer o alimento mesmo antes da presença do alimento.

Uma das características principais da relação reflexa pavloviana é a dependência entre o estímulo e a resposta. Trata‑se de uma relação do tipo “tudo ou nada” (Skinner, 1953/1965, 1957/1961d): a resposta sempre ocorrerá em função da presença do estímulo, ou seja, se não houver estímulo não há resposta. É por isso que dizemos que o estímulo elicia a resposta do organismo (Skinner, 1937/1961i, 1938/1966a, 1953/1965, 1966b, 1969e, 1980/1998). Entretanto, ao constatar que muitas respostas não possuíam estímulos prévios correlatos, Skinner sugeriu que haveria um segundo tipo de relação reflexa: o operante. Nas palavras do autor (1937/1961i, p.378):

Primeiramente, há o tipo de resposta que é [eliciada] por uma estimulação específica, em que a correlação entre a resposta e o estímulo é um reflexo no sentido tradicional. Irei classificar esse reflexo de respondente. […] Mas há também um tipo de resposta que ocorre espontaneamente na ausência de qualquer estimulação com a qual ela possa estar especificamente correlacionada. […] É da natureza desse tipo de comportamento ocorrer sem um estímulo eliciador, embora estímulos discriminativos sejam praticamente inevitáveis após o condicionamento. Não é necessário identificar unidades específicas antes do condicionamento, mas durante o condicionamento elas poderão se estabelecer. Irei chamar tais unidades de operantes, e o comportamento em geral de comportamento operante.

É nesse texto que pela primeira vez Skinner utilizou o termo “operante” (Skinner, 1980/1998). À relação reflexa tradicional, isto é, ao reflexo pavloviano, Skinner deu o nome de respondente. Nesse caso, como já vimos, o condicionamento ocorreria mediante a apresentação de estímulos neutros pareada à apresentação de estímulos incondicionados. Com o condicionamento estabelecido, o estímulo condicionado passa a exercer a função de “preparar” o organismo para a apresentação do estímulo incondicionado.

Nota‑se que todo o processo de condicionamento envolve a manipulação de estímulos para que respostas sejam eliciadas. Entretanto, o operante exigiria outra estratégia, já que não haveria relações respondentes previamente identificáveis ou estímulos eliciadores específicos (Skinner, 1937/1961i). A falta de um estímulo prévio eliciador gerou um problema prático na análise experimental do comportamento: a impossibilidade de controlar a ocorrência de respostas por meio da apresentação de estímulos (Skinner, 1980/1998).

No experimento de Pavlov, controlar a ocorrência da salivação era relativamente fácil, pois bastava apenas apresentar o estímulo eliciador. No operante, por outro lado, era preciso esperar a resposta aparecer para só então exercer algum tipo de controle sobre ela (Skinner, 1980/1998). Mas o processo não é tão simples quanto parece. Em um primeiro contato com a caixa de Skinner, por exemplo, é improvável que o pressionar a barra esteja entre as respostas iniciais de um sujeito experimental.

Trata‑se de uma resposta com topografia bastante complexa se levarmos em conta o organismo (rato) e a sua história filogenética. Nesse contexto, a modelagem do comportamento – atividade que consiste em manipular o ambiente por meio da apresentação de estímulos consequentes contingenciais às ocorrências de respostas com o objetivo de reforçar classes de respostas que sucessivamente se aproximam topograficamente da classe de respostas desejada – é imprescindível (Skinner, 1980/1998).

No caso do pressionar a barra, a primeira aproximação pode ser o movimento da cabeça do organismo em direção à barra; a segunda aproximação pode ser tocar o focinho na barra; a terceira pode ser morder a barra; a quarta pode ser levantar a pata enquanto o focinho está encostado na barra; e assim por diante, até que, eventualmente, a resposta desejada – pressionar a barra com a pata – ocorra. Comportamentos bastante complexos, e que possivelmente não ocorreriam se os organismos estivessem em seus ambientes naturais, foram modelados em situações experimentais.

Skinner (1958) chegou, a modelar pombos a ponto de conseguir fazê‑los jogar boliche. O processo de modelagem traz questões importantes. Qual seria a função do estímulo antecedente? O foco, no condiciona‑ mento operante, voltou‑se totalmente para a resposta e, à primeira vista, parece que o estímulo antecedente perdeu importância. E mais, a modelagem só é possível graças às consequências apresentadas após as ocorrências das respostas.

Qual seria, então, o papel das consequências no condicionamento operante? As respostas a essas questões constituem o âmago do operante. Diz‑se que o organismo opera sobre o ambiente gerando, assim, consequências (Skinner, 1953/1965). É interessante notar que o termo “operar” indica uma ação. As definições do dicionário ­Houaiss (2001) são esclarecedoras: “1. exercer ação, função, atividade ou ofício; agir, trabalhar, obrar; 3. provocar uma reação; produzir, surtir (um efeito)”. Assim, a resposta operante é essencial‑ mente uma ação do organismo que produz efeitos no ambiente.

As consequências, em seu turno, são as modificações geradas pela ação do organismo. A caracterização das consequências dependerá da análise funcional feita sobre a relação como um todo. Observa‑se a frequência de uma dada resposta, depois torna‑se um evento a ela contingente (consequência) e, finalmente, constata‑se se há qual‑ quer mudança na frequência de respostas pertencentes à classe selecionada para estudo (Skinner, 1953/1965). Se houver aumento nessa frequência, o que indicaria também o aumento da probabilidade de que respostas pertencentes a essa classe possam ocorrer, o evento contingente é classificado como sendo reforçador sob aquela dada circunstância.

Sendo assim, as respostas operantes ocorrem sempre em função dos eventos consequentes (Skinner, 1938/1966a). O organismo sempre está inserido em um ambiente. No caso do respondente, os estímulos eliciadores são eventos ambientais responsáveis diretamente pela ocorrência de respostas reflexas. Já no caso operante, “o estímulo é meramente a ocasião para a ação” (Skinner, 1967, p.326). A diferença essencial é que, em vez de eliciarem respostas, numa relação operante os estímulos constituem a ocasião em que uma dada contingência está em vigor (Skinner, 1945/1961g, 1953/1965, 1966b, 1967, 1975, 1969e).

Entretanto, a ausência de um estímulo eliciador pode sugerir a ideia errada de que não há qualquer função para os estímulos antecedentes na relação operante. Essa ideia é errada porque “os estímulos estão sempre agindo sobre o organismo” e a única diferença é que as “suas conexões funcionais com o comportamento operante não são iguais às do reflexo” (Skinner, 1953/1965, p.107). A função dos estímulos antecedentes na relação operante se torna evidente no caso dos operantes discriminados.

Tomemos como exemplo uma relação operante em que a classe de respostas de pressionar a barra seja contingente à apresentação de alimento (consequência reforçadora). Num dado momento, modificamos o ambiente acendendo uma luz dentro da caixa de Skinner e estabelecemos a seguinte contingência: paramos de apresentar a consequência reforçadora quando a luz estiver apagada e voltamos a apresentar a consequência reforçadora quando a luz estiver acesa. Os passos do processo estão no Quadro 2.3. Nas situações 1 e 2 temos a contingência previamente estabelecida, em que tanto a presença quanto a ausência da luz não possuem função discriminativa.

Entretanto, as situações 3 e 4 atribuem uma função discriminativa à luz acesa. Com a luz apagada, as res‑ postas de pressionar a barra não são seguidas por consequências reforçadoras (situação 3). Por outro lado, com a luz acesa, as res‑ postas de pressionar a barra são seguidas por consequências reforçadoras (situação 4). Dessa forma, a luz acesa passa a exercer a função de estímulo discriminativo (Sd) que indica a ocasião em que respostas de pressionar a barra serão seguidas de consequências reforçadoras.

Classificamos a luz acesa como estímulo discriminativo porque ela não é responsável diretamente pela ocorrência da res‑ posta, mas serve apenas como uma “propriedade do ambiente” que discrimina, isto é, que distingue a ocasião ou o contexto em que a ocorrência da resposta será seguida pela consequência reforçadora. É importante ressaltar que, embora não atue diretamente como estímulo eliciador da resposta, o estímulo discriminativo possui

Behaviorismo:  Do reflexo ao operante

controle sobre a ocorrência de respostas operantes (Skinner, 1953/1965, 1966b, 1989c). Especificamente, se respostas pertencentes à mesma classe forem seguidas de consequências reforçadoras quando uma dada propriedade do ambiente estiver presente, e não forem seguidas de consequências reforçadoras na ausência da mesma propriedade do ambiente, então a probabilidade de ocorrência de respostas pertencentes a essa classe será maior quando tal propriedade do ambiente estiver presente.

Assim, os estímulos discriminativos exercem controle sobre a frequência de respostas operantes (Skinner, 1969b). No caso do exemplo, o aumento da frequência de respostas de pressionar a barra quando a luz está acesa e a diminuição da frequência quando a luz está apagada indica que a luz possui função discriminativa nessa contingência operante. Se não possuísse, a frequência de respostas possivelmente não variaria de acordo com sua ausência ou presença. A seguinte citação de Skinner (1969e, p.7) resume de maneira acurada o processo:

Usar a frequência de respostas como a variável dependente, tornou possível formular de maneira mais adequada as interações entre um organismo e o seu ambiente. Os tipos de consequências que aumentam a frequência (‘“reforçadoras”) são positivas ou negativas, dependendo se elas reforçam quando aparecem ou quando desaparecem. A classe de resposta sobre a qual um reforço é contingente é chamada de operante, para sugerir a ação sobre o ambiente seguida pelo reforço. Construímos um operante ao tornar um reforço contingente a uma resposta, mas o fato importante sobre as unidades resultantes não é sua topografia, mas sim sua probabilidade de ocorrência, observada como frequência de emissão. O estímulo precedente não é irrelevante. Qualquer estímulo presente quando um operante é reforçado adquire controle no sentido de que a frequência [de resposta] será maior em sua presença. Tal estímulo não age como incitador; ele não elicia a resposta no sentido de forçá‑la a ocorrer. Ele é simplesmente um aspecto essencial da ocasião em que uma resposta, [se emitida], é reforçada. A diferença fica clara ao chamá‑lo de estímulo discriminativo (ou Sd). Uma formulação adequada da interação entre um organismo e seu ambiente deve sempre especificar três coisas: (1) a ocasião em que uma resposta ocorre, (2) a resposta em si, e (3) as consequências reforçadoras. As inter‑relações entre esses três [eventos] são as “contingências de reforço”.

No entanto, antes mesmo de propor uma divisão entre respondente e operante, Skinner estava preocupado com o estabeleci‑ mento dos parâmetros que deveriam ser seguidos na delimitação dos estímulos, das respostas e do reflexo e com a possibilidade de se fazer uma análise acurada do comportamento levando‑se em conta as “linhas naturais de fratura ao longo das quais o comporta‑ mento e o ambiente realmente se separam” (Skinner, 1935/1961e, p.347). De acordo com o autor (1935/1961e), a análise não poderia fundamentar‑se na divisão arbitrária do ambiente e do comporta‑ mento em unidades estímulo‑resposta.

Era preciso o desenvolvi‑ mento de uma estratégia adequada para fazê‑lo. Nesse contexto, uma estratégia possível seria apresentar uma descrição meticulosa tanto do estímulo quanto da resposta a partir de suas propriedades físicas. Essa descrição priorizaria as propriedades independentes do estímulo e da resposta, isto é, um estímulo S seria descrito a partir de suas propriedades físicas Fs1, Fs2, Fs3…, Fsn, e uma res‑ posta R seria descrita a partir de suas propriedades físicas Fr1, Fr2, Fr3…, Frn. Consequentemente, as definições (sempre descritivas) tanto do estímulo quanto da resposta seriam independentes entre si.

Skinner (1935/1961e) afirma que definir os estímulos e as res‑ postas por meio das descrições de suas propriedades físicas ocasiona problemas. Os estímulos e as respostas são, acima de tudo, eventos e não propriedades dos eventos (Skinner, 1935/1961e). Isso significa que a ocorrência de um estímulo não é a ocorrência de uma mudança física do ambiente que, em si, possui a propriedade de ser um estímulo. Pelo contrário, o estímulo é, em si, o evento que ocorre, e sua identificação não está em suas propriedades físicas, mas em sua relação funcional com a resposta subsequente.

Dessa forma, definir o estímulo apenas a partir de suas propriedades físicas pode excluir o caráter relacional do conceito. Outro problema da definição baseada nas propriedades físicas é que os eventos não se repetem exatamente da maneira como ocorreram no passado. Precisamente, os eventos nunca se repetem. É improvável que um evento E2 possua exatamente as mesmas propriedades físicas que constituíram um evento E1 no passado. Por‑ tanto, se levarmos em conta apenas as propriedades físicas dos eventos, em seus mínimos detalhes, seremos exatos em nossas descrições, mas trataremos de eventos sempre diferentes.

A busca de uma descrição precisa pode resultar na restrição da pesquisa a eventos únicos, o que impossibilitaria o desenvolvimento de uma unidade conceitual pela qual seria possível estudar o comporta‑ mento. Um exemplo de unidade conceitual é a relação respondente “estímulo sonoro à salivação” citada anteriormente. O problema nesse caso é que não poderíamos definir essa relação como uma “unidade” porque as propriedades físicas do estímulo sonoro e da salivação seriam únicas a cada ocorrência.

Não poderíamos dizer, portanto, que o cão está sob controle de uma relação respondente específica porque cada relação seria uma relação diferente. Em suma, a descrição baseada puramente nas propriedades físicas pode transgredir a natureza relacional dos conceitos e acaba por resultar no estudo de eventos únicos, impossibilitando, assim, o desenvolvimento de uma unidade conceitual de análise do comportamento. A saída de Skinner a esse problema está no conceito de classes. Nas palavras do autor (1938/1966a, p.34):

O termo “estímulo” precisa se referir a uma classe de eventos cujos membros possuem alguma propriedade em comum, mas que, em outros aspectos, diferem livremente, e o termo “res‑ posta” para uma classe similar que mostra um maior grau de liberdade de variação, mas que é também definida rigorosamente a partir de uma ou mais propriedades. A correlação chamada reflexo é uma correlação entre classes, e o problema da análise é o problema de achar as propriedades definidoras corretas.

Existem estímulos e respostas que podem diferir livremente em suas propriedades físicas. O caráter demarcatório que justificará classificar respostas e estímulos que possuem propriedades físicas diversas nas mesmas classes é a função que essas respostas e estímulos exercem numa relação comportamental. O problema da análise será, então, descobrir quais são as propriedades funcional‑ mente relevantes. No caso do exemplo de condicionamento operante de pressionar a barra na presença da luz, sabemos que a propriedade funcionalmente relevante do estímulo discriminativo é ser uma luz com uma dada intensidade e sabemos que no caso das respostas a propriedade topográfica “pressionar a barra com a pata” possui relevância funcional.

Sabemos disso porque, ao apagarmos a luz da caixa, a frequência de respostas diminui, e, se o rato pressionar a barra com o focinho, a consequência reforçadora não se seguirá. A questão central é que, embora o organismo possa pressionar a barra de uma maneira bastante estereotipada, a ocorrência de uma resposta nunca é idêntica à ocorrência de outra. É por isso que falamos de “classes de respostas” e “classes de estímulos” e é justamente por isso, também, que Skinner (1935/1961e, 1938/1966a, 1979, 1980/1998) afirma que os estímulos e as respostas são conceitos de natureza genérica, passíveis de identificação apenas por meio das relações funcionais estabelecidas entre os eventos estudados.

Uma questão importante a ser ressaltada quando se trata dos conceitos genéricos é: o que as consequências modificam? Afinal, se uma resposta nunca é idêntica à outra, como uma consequência poderia surtir qualquer efeito na resposta que já ocorreu? Enfim, como seria possível o processo de condicionamento? De acordo com Skinner (1953/1965, 1989c), as consequências não alteram as respostas que já ocorreram, mas sim a probabilidade de que res‑ postas que pertencem à mesma classe possam ocorrer no futuro.

É nesse contexto que o termo “reforço” faz sentido. Dizemos que um evento é reforçador quando ele fortalece a classe operante da qual faz parte no sentido de aumentar a probabilidade de que respostas que pertençam à mesma classe ocorram (Skinner, 1953/1965, 1969e, 1974). Confere‑se o aumento da probabilidade, por sua vez, pela análise do aumento da frequência das respostas. É inexato dizer que apresentar a consequência reforçadora é o mesmo que “recompensar” o organismo pela resposta, já que o evento reforçador fortalece toda a classe operante em vez de uma resposta única (Skinner, 1963b, 1969e).

Em tempo, visto que a pertinência da proposta skinneriana de distinção entre respondente e operante é um dos temas mais debatidos na análise do comportamento (e.g., Catania, 1971, 1973; Coleman, 1981; Donahoe & Palmer, 1994; Donahoe & Wessells, 1980; Glenn, Ellis & Greenspoon, 1992; Keller & Schoenfeld, 1950/1974; Malone, 1991; Pear & Eldridge, 1984; Rehfeldt & Hayes, 1998; Scharff, 1982), considera‑se, então, que discorrer um pouco mais sobre esse tópico é uma atividade relevante. Até o momento já foram apresentadas algumas das possíveis diferenças entre respondente e operante.

A primeira delas é a ausência, no caso do operante, de estímulos antecedentes eliciadores de res‑ postas. A seguinte passagem de Skinner (1977, p.4) ressalta essa característica: “No reflexo, condicionado ou incondicionado, há uma causa antecedente conspícua. Algo dispara a resposta. Mas o comportamento que tem sido reforçado positivamente ocorre em ocasiões que, embora predisponham, nunca são impelentes”. Essa diferença, por sua vez, contribui para a caracterização do respondente como uma relação de causa‑efeito.

Até mesmo a passagem de Skinner (1977) supracitada sugere que no respondente há uma “causa antecedente”. No operante, por sua vez, não haveria “causas” que impelissem a ocorrência de respostas, mas apenas estímulos que “meramente configuram a ocasião em que é mais provável que uma resposta ocorra” (Skinner, 1966b, p.1206). É por conta desse fato que dizemos que as respostas, no caso do operante, não são eliciadas, mas são emitidas pelo organismo (Skinner, 1953/1965, 1974).

É também por conta dessa diferença que normalmente se atribui ao respondente a característica de comporta‑ mento involuntário e ao operante a característica de comportamento voluntário (Skinner, 1953/1965, 1974). Outra diferença entre respondente e operante está no próprio processo de condicionamento. No primeiro caso são estabelecidas relações entre estímulos: através do condicionamento respondente, um estímulo, em princípio neutro, passa a ter a função de “preparar” o organismo para a ocorrência do estímulo incondicionado.

A função de “preparação” é estabelecida quando o estímulo condicionado passa a eliciar respostas que antes eram eliciadas apenas por estímulos incondicionados. No operante, por sua vez, são estabelecidas relações entre respostas e estímulos consequentes: através do condicionamento operante, estímulos consequentes são responsáveis por aumentar ou diminuir a frequência de respostas pertencentes à mesma classe. Nesse caso, os estímulos que constituem a ocasião em que uma dada classe operante é reforçada passam a exercer certo controle sobre a probabilidade de resposta: em ocasiões semelhantes, a probabilidade de ocorrência de respostas pertencentes a essa classe é maior.

Ao contrário do que ocorre no respondente, em que o controle é sempre estabelecido pelos estímulos antecedentes eliciadores de respostas, no operante, o controle só é estabelecido em função dos estímulos consequentes. É possível notar como a ausência de estímulos eliciadores e as diferenças entre os processos de condicionamento refletem-se em formas diferentes de se estudar o respondente e o operante. No respondente, avalia‑se a força da relação; avaliação que ocorre principalmente a partir de quatro medidas (Catania, 1999; Skinner, 1938/1966a): (1) limiar: intensidade de um estímulo necessária para eliciar uma resposta; (2) latência: período de tempo entre estímulo e resposta; (3) magnitude: grau de intensidade da resposta; e (4) duração: intervalo de tempo correspondente à ocorrência da res‑ posta.

Uma relação respondente é “forte” quando a latência é curta, a magnitude da resposta é alta e a duração é longa; e é “fraca” quando a latência é longa, a magnitude é baixa e a duração é curta. A variável independente nessa relação é o limiar do estímulo. Presume‑se que quanto mais alta for a intensidade do estímulo mais forte será o respondente e quanto mais baixa for a intensidade mais fraco ele será.16 Nesse contexto, a importância das propriedades físicas dos estímulos e das respostas é evidente, pois as principais variações das relações respondentes ocorrem em função da manipulação direta das propriedades físicas dos estímulos elicia‑ dores.

Por conta desse fato, à relação respondente é atribuída a al‑ cunha de mecanicista (Moxley, 1992, 1997). O estudo do operante, por sua vez, não depende do tipo de aná‑ lise e manipulação utilizado no caso do respondente. O dado experimental básico é a frequência das respostas; e estas, por sua vez, são funcionalmente classificadas dentro de uma mesma classe de acordo com as consequências que as seguem.

Em ambos os casos não é preciso que exista uma relação íntima com as propriedades físicas dos eventos. Essas propriedades talvez sirvam – mas não necessariamente – como traços recorrentes das respostas e dos estímulos que fazem parte das mesmas classes. Não é preciso sustentar, também, uma relação do tipo “tudo ou nada”, já que estamos tratando com probabilidades de ocorrência de respostas pertencentes a uma classe. Nas palavras de Skinner (1937/1961i, p.380):

O comportamento operante não pode ser tratado pela técnica concebida para [o estudo] dos respondentes (Sherrington e Pavlov) porque na ausência de um estímulo eliciador muitas das medidas da força do reflexo desenvolvidas para [o estudo] dos respondentes são desprovidas de sentido. No operante não há propriamente latência (exceto com relação ao estímulo discriminativo), não há duração [after‑discharge], e o mais importante de tudo, não há relação entre as magnitudes da R [resposta] e do S [estímulo]. A despeito dos repetidos esforços para tratá‑la dessa forma, a magnitude da resposta no operante não é uma medida de sua força. Alguma outra medida deve ser concebida, e da definição do operante é fácil chegar à taxa de ocorrência de resposta.

Não devemos supor, porém, que as propriedades físicas dos estímulos e das respostas não são relevantes nas relações operantes. Pelo contrário, as diferenças entre respondentes e operantes acerca de seus métodos de estudo e de suas medidas de análise indicam apenas que há papéis diferentes, mas não ausentes, para as proprie-

Behaviorismo:  Do reflexo ao operante

dades físicas dos elementos constituintes das contingências. Para esclarecer essa questão analisemos o Gráfico 2.1.17 O retângulo formado entre os pontos S1 e Sn (linha tracejada‑ ‑pontilhada) corresponde às variações físicas de estímulos discriminativos pertencentes à mesma classe. Por exemplo: luzes de diversas intensidades podem servir de estímulo discriminativo para a mesma classe operante. Nesse caso, entre S1 e Sn estão as variações de intensidade de luz que podem atuar como estímulo discriminativo para uma classe operante. O mesmo ocorre, por sua vez, com a topografia das respostas.

O retângulo formado entre os pontos R1 e Rn (linha pontilhada) corresponde às variações topo‑ gráficas e, portanto, físicas, das respostas pertencentes à mesma classe. Por exemplo: respostas de pressionar a barra com a pata nunca são idênticas. Mas é preciso que elas possuam certo grau de estereotipia para que possam ser enquadradas na mesma classe, tais como a utilização da pata esquerda para pressionar a barra ou o pressionar a barra com dada força para que ela se mova, e assim por diante. No gráfico há também três linhas: A (pontilhada espaçada), B (pontilhada próxima) e C (contínua).

Todas correspondem ao comportamento de um mesmo organismo num dado período de tempo. O eixo X indica a frequência de respostas e o eixo Y indica a de‑ marcação das características físicas dos estímulos e das respostas. Agora, lembremo‑nos do exemplo de operante discriminado citado anteriormente, em que a luz acesa atua como estímulo discriminativo indicador da ocasião em que respostas de pressionar a barra são seguidas de consequências reforçadoras. Nesse contexto, a linha A corresponde ao comportamento do organismo num período prévio ao estabelecimento da contingência em questão.

O gráfico indica que a topografia das respostas é bastante variada, pois não há concentração de frequências de respostas em nenhum ponto do eixo Y. A linha B, por sua vez, corresponde ao comportamento do organismo no período de modelagem da classe operante através da vigência da contingência em questão. Nota‑se que há aumento na frequência de respostas que possuem propriedades topográficas semelhantes demarcadas no eixo Y pelo retângulo formado entre os pontos R1 e Rn.

Entretanto, a frequência de respostas não parece estar condicionada às características físicas dos estímulos demarcadas no eixo Y pelo retângulo formado entre os pontos S1 e Sn. Finalmente, há a linha C, correspondente ao comportamento do organismo quando a classe operante modelada de acordo com as contingências em questão está estabelecida. A concentração da frequência de respostas é evidente: praticamente todas as respostas emitidas pelo organismo estão localizadas no retângulo entre R1 e Rn, o que significa que são respostas que possuem propriedades topográficas bastante semelhantes.

Além disso, a grande maioria das respostas foi emitida na presença de certas características físicas do ambiente – especificamente luzes cujas intensidades variam entre S1 e Sn – que passaram a exercer a função de estímulo discriminativo. Que conclusões é possível extrair desse caso hipotético? Primeiramente, que as propriedades físicas dos estímulos e das respostas são essenciais no estabelecimento de contingências e também na consolidação de classes de operantes.

Em segundo lugar, que a única diferença entre respondente e operante no que concerne às propriedades físicas dos estímulos e das respostas está em suas funções. No respondente, as propriedades físicas são as responsáveis pelas características das relações. A “força” da relação respondente está condicionada às propriedades físicas dos elementos que a constituem. Por outro lado, no operante, as contingências é que são responsáveis pelas propriedades físicas dos elementos que constituem a relação.

Isto é: as propriedades físicas tanto dos estímulos quanto das respostas são selecionadas de acordo com as consequências. No caso do exemplo, propriedades físicas dos estímulos (S1‑Sn) e das respostas (R1‑Rn) foram selecionadas porque, quando o organismo emitiu respostas pertencentes à mesma classe na presença de propriedades físicas do ambiente enquadradas na mesma classe de estímulo discriminativo, consequências reforçadoras foram apresentadas.

Em síntese, é possível supor que as características das relações respondentes são determinadas pelas propriedades físicas dos elementos que as constituem, enquanto as propriedades físicas dos elementos das relações operantes são determinadas pelas próprias relações. Continuando no campo do condicionamento, há ainda outra diferença entre respondente e operante. No primeiro caso, o ponto de partida são relações incondicionadas preexistentes no repertório do organismo, o que significa que a quantidade de relações respondentes condicionadas possíveis é função do repertório de respondentes incondicionados de um sujeito (Glenn, Ellis & Greenspoon, 1992).

O condicionamento operante, por sua vez, não depende direta‑ mente de relações incondicionadas preexistentes. Afinal, o estabelecimento de um operante no repertório de um organismo se dá através de contingências em que respostas pertencentes à mesma classe são seguidas de estímulos consequentes (Glenn, Ellis & Green‑spoon, 1992). Os exemplos de condicionamento citados anteriormente tornam essa diferença clara: no caso do cão de Pavlov, parte‑se de uma relação respondente incondicionada (“comida à salivação”) para, então, estabelecer uma relação respondente condicionada (“campainha à salivação”); no caso do operante, respostas de pressionar a barra com a pata são seguidas de consequências reforçadoras.

O condicionamento operante envolve a modelagem do responder até que o organismo passe a emitir respostas pertences à classe desejada. Não há processo similar no condicionamento respondente. Nas palavras de Catania (1999, p.211): “Podemos criar novos operantes através da modelagem, mas as propriedades dos respondentes são determinadas por seus estímulos eliciadores, de modo que não há, para o comportamento respondente, um procedimento análogo à modelagem”. Presume‑se, assim, que, num dado repertório comportamental, a quantidade de relações operantes distintas possíveis seja bem maior do que a quantidade de relações respondentes distintas possíveis.

É possível observar, portanto, que Skinner apresentou diferenças notáveis entre o respondente e o operante – diferenças que abarcam não só os métodos e medidas de análise desses processos, mas que também sugerem uma divisão mais fundamental, em que “respondente” e “operante” não seriam apenas dois procedi‑ mentos, mas sim dois fenômenos comportamentais distintos (Pear & Eldridge, 1984). Entretanto, como foi dito anteriormente, a validade da dicotomia respondente‑operante ainda é tema de intenso debate na análise do comportamento e está fora do escopo deste livro fornecer uma resposta ao problema.

Para finalizar, é importante ressaltar que, embora no início de suas pesquisas, mesmo após o estudo com operantes, Skinner tenha utilizado o termo “reflexo” para ambos os tipos de relações, posteriormente o autor restringiu a utilização do termo apenas para se referir ao respondente (Skinner, 1979, 1980/1998). Há, assim, dois processos comportamentais principais: o respondente e o operante.

Licença Creative Commons
Este obra está licenciado com uma Licença Creative Commons Atribuição-NãoComercial-CompartilhaIgual 4.0 Internacional.

REFERÊNCIAS:

A natureza comportamental da mente: behaviorismo radical e filosofia da mente / Diego Zilio. – São Paulo: Cultura Acadêmica, 2010.