9장 단위 테스트

TDD 법칙 세 가지

TDD가 실제 코드를 작성하기 전에 단위 테스트를 작성한다는 것은 누구나 알고 있다. 하지만 이 규칙은 빙산의 일각에 불과하다. 다음 세 가지 법칙을 살펴보자

첫째 법칙 : 실패하는 단위 테스트를 작성할 때까지 실제 코드를 작성하지 않는다.
둘째 법칙 : 컴파일은 실패하지 않으면서 실행이 실패하는 정도로만 단위 테스트를 작성한다.
셋째 법칙 : 현재 실패하는 테스트를 통과할 정도로만 실제 코드를 작성한다.

위 세 가지 규칙을 따르면 개발과 테스트가 대략 30초 주기로 묶인다. 테스트 코드와 실제 코드가 함께 나올뿐더러 테스트 코드가 실제 코드보다 불과 몇 초 전에 나온다.

이렇게 일하면 (매일 수십 개, 매달 수백 개, 매년 수천 개에 달하는) 실제 코드를 사실상 전부 테스트하는 테스트 케이스가 나온다. 하지만 실제 코드와 맞먹을 정도로 방대한 테스트 코드는 심각한 관리 문제를 유발하기도 한다.

깨끗한 테스트 코드 유지하기

몇년 전 지은이는 어떤 개발팀을 코치한 경험이 있었다. 이 팀에 대한 현재 상황은...

팀원들은 서로에게 단위 테스트에서 규칙을 깨도 좋다는 무언의 동의가 있었다.
'지저분해도 빨리'가 주제어였다.
테스트 함수는 간결하거나 서술적일 필요가 없었다.
테스트 코드는 잘 설계하거나 주의해서 분리할 필요가 없었다.

그저 실제 코드를 테스트만 하면 그만이었다.....

팀이 내린 결정에 공감하는 독자들이 있을지도 모른다.

일회용 테스트 코드를 짜오다가 세삼스레 자동화된 단위 테스트 슈트를 짜기란 쉽지 않다. 그래서 팀은 테스트를 안 하느니 지저분한 테스트 코드라도 있는 편이 좋다고 판단했을지도 모른다.

지저분한 테스트 코드는 안하는 것만 못하다

문제는 실제 코드가 진화하면 테스트 코드도 변해야 한다는 데 있다. 그런데 테스트 코드가 지저분할수록 변경하기 어려워진다. 실제 코드를 변경해 기존 테스트 케이스가 실패하기 시작하면, 지저분한 코드로 인해, 실패하는 테스트 케이스를 점점 더 통과시키기 어려워진다. 그래서 테스트 코드는 계속해서 늘어나는 부담이 되버린다.

새 버전을 출시할 때마다 팀이 테스트 케이스를 유지하고 보수하는 비용도 늘어난다. 점차 테스트 코드는 개발자 사이에서 가장 큰 불만으로 자리잡는다. 관리자가 예측값이 너무 큰 이유를 물어보면 팀은 테스트 코드를 비난한다. 결국 테스트 슈트를 폐기하지 않으면 안 되는 상황에 처한다.

하지만 테스트 슈트가 없으면 개발자는 자신이 수정한 코드가 제대로 도는지 확인할 방법이 없다. 의도하지 않은 결함 수가 많아지면 개발자는 변경을 주저한다. 변경하면 득보다 해가 크다 생각해 더 이상 코드를 정리하지 않는다. 그러면서 코드가 망가지기 시작한다. 결국 테스트 슈트도 없고, 얼기설기 뒤섞인 코드에 좌절한 고객과, 테스트에 쏟아 부은 노력이 허사였다는 실망감만 남는다.

어떤 면에서 그들이 옳았을지 모른다.

테스트에 쏟아 부은 노력은 확실히 허사였다. 하지만 실패를 초래한 원인은 테스트 코드를 막 짜도 좋다고 허용한 결정이었다. 테스트 코드를 깨끗하게 짰다면 테스트에 쏟아 부은 노력은 허사로 돌아가지 않았을 터이다. 지은이가 이처럼 자신 있게 말하는 이유는 지은이가 참여하고 조언한 많은 팀이 깨끗한 단위 테스트 코드로 성공했기 때문이다.

테스트 코드는 실제 코드 못지 않게 중요하다. 테스트 코드는 사고와 설계와 주의가 필요하다.

테스트는 유연성, 유지보수성, 재사용성을 제공한다.

테스트 코드를 깨끗하게 유지하지 않으면 결국은 잃어버린다.

테스트 케이스가 있으면 변경이 두렵지 않다.
테스트 케이스가 없다면 모든 변경이 잠정적인 버그다.
테스트 케이스가 없으면 개발자는 변경을 주저한다. 버그가 숨어들까 두렵기 때문이다.
테스트 케이스가 있으면 변경이 쉬워진다. => 테스트는 유연성, 유지보수성, 재사용성을 제공한다.

따라서 테스트 코드가 지저분하면 코드를 변경하는 능력이 떨어지며 코드 구조를 개선하는 능력도 떨어진다. 테스트 코드가 지저분할수록 실제 코드도 지저분해진다. 결국 테스트 코드를 잃어버리고 실제 코드도 망가진다.

깨끗한 테스트 코드

깨끗한 테스트 코드를 만들려면? 세 가지가 필요하다.

가독성
가독성
가독성

테스트 코드에서 가독성을 높이려면? 세 가지가 필요하다.

명료성
단순성
풍부한 표현력

다음은 FitNess에서 가져온 코드이다. 아래 테스트 케이스 세 개는 이해하기 어렵기에 개선할 여지가 충분하다.

addPage와 assertSubString을 부르느라 중복되는 코드가 매우 많다.
자질구레한 사항이 너무 많아 테스트 코드의 표현력이 떨어진다.
읽는 사람을 고려하지 않는다.

리팩토링이 필요한 테스트 코드

public void testGetPageHieratchyAsXml() throws Exception {
  crawler.addPage(root, PathParser.parse("PageOne"));
  crawler.addPage(root, PathParser.parse("PageOne.ChildOne"));
  crawler.addPage(root, PathParser.parse("PageTwo"));

  request.setResource("root");
  request.addInput("type", "pages");
  Responder responder = new SerializedPageResponder();
  SimpleResponse response =
    (SimpleResponse) responder.makeResponse(new FitNesseContext(root), request);
  String xml = response.getContent();

  assertEquals("text/xml", response.getContentType());
  assertSubString("<name>PageOne</name>", xml);
  assertSubString("<name>PageTwo</name>", xml);
  assertSubString("<name>ChildOne</name>", xml);
}

public void testGetPageHieratchyAsXmlDoesntContainSymbolicLinks() throws Exception {
  WikiPage pageOne = crawler.addPage(root, PathParser.parse("PageOne"));
  crawler.addPage(root, PathParser.parse("PageOne.ChildOne"));
  crawler.addPage(root, PathParser.parse("PageTwo"));

  PageData data = pageOne.getData();
  WikiPageProperties properties = data.getProperties();
  WikiPageProperty symLinks = properties.set(SymbolicPage.PROPERTY_NAME);
  symLinks.set("SymPage", "PageTwo");
  pageOne.commit(data);

  request.setResource("root");
  request.addInput("type", "pages");
  Responder responder = new SerializedPageResponder();
  SimpleResponse response =
    (SimpleResponse) responder.makeResponse(new FitNesseContext(root), request);
  String xml = response.getContent();

  assertEquals("text/xml", response.getContentType());
  assertSubString("<name>PageOne</name>", xml);
  assertSubString("<name>PageTwo</name>", xml);
  assertSubString("<name>ChildOne</name>", xml);
  assertNotSubString("SymPage", xml);
}

public void testGetDataAsHtml() throws Exception {
  crawler.addPage(root, PathParser.parse("TestPageOne"), "test page");

  request.setResource("TestPageOne"); request.addInput("type", "data");
  Responder responder = new SerializedPageResponder();
  SimpleResponse response =
    (SimpleResponse) responder.makeResponse(new FitNesseContext(root), request);
  String xml = response.getContent();

  assertEquals("text/xml", response.getContentType());
  assertSubString("test page", xml);
  assertSubString("<Test", xml);
}

crawler 쪽 코드는 테스트 코드와 무관하며 테스트 코드의 의도만 흐린다.
responder를 생성하는 코드, response를 수집해 변환하는 코드 모두 잡음에 불과하다.
resource와 인수에서 요청 URL을 만드는 어설픈 코드(request.setResource("TestPageOne"); request.addInput("type", "data");)도 있다.

=> 이러한 코드는 읽는 사람을 고려하지 않는다. 불쌍한 독자들은 온갖잡다하고 무관한 코드를 이해한 후라야 간단한 테스트를 이해한다.

리팩토링한 테스트 코드

public void testGetPageHierarchyAsXml() throws Exception {
  makePages("PageOne", "PageOne.ChildOne", "PageTwo");

  submitRequest("root", "type:pages");

  assertResponseIsXML();
  assertResponseContains(
    "<name>PageOne</name>", "<name>PageTwo</name>", "<name>ChildOne</name>");
}

public void testSymbolicLinksAreNotInXmlPageHierarchy() throws Exception {
  WikiPage page = makePage("PageOne");
  makePages("PageOne.ChildOne", "PageTwo");

  addLinkTo(page, "PageTwo", "SymPage");

  submitRequest("root", "type:pages");

  assertResponseIsXML();
  assertResponseContains(
    "<name>PageOne</name>", "<name>PageTwo</name>", "<name>ChildOne</name>");
  assertResponseDoesNotContain("SymPage");
}

public void testGetDataAsXml() throws Exception {
  makePageWithContent("TestPageOne", "test page");

  submitRequest("TestPageOne", "type:data");

  assertResponseIsXML();
  assertResponseContains("test page", "<Test");
}

각 테스트는 명확히 세부분으로 나눠진다.

BUILD-OPERATE-CHECK 패턴이 위와 같은 테스트 구조에 적합하다.
- 첫 부분은 테스트 자료를 만든다. (BUILD) makePages, addLinkTo
- 두 번째 부분은 테스트 자료를 조작한다. (OPERATE) submitRequest
- 세 번째 부분은 조작한 결과가 올바른지 확인한다 (CHECK) assertResponseIsXML

=> 잡다하고 세세한 코드를 거의 다 없앴다.

테스트 코드는 본론에 돌입해 진짜 필요한 자료 유형과 함수만 사용한다.
코드를 읽는 사람은 잡다하고 세세한 코드로 헷갈릴 필요 없이 코드가 수행하는 기능을 재빨리 이해할 수 있다.

도메인에 특화된 테스트 언어

위 [리팩토링한 테스트 코드]는 도메인에 특화된 언어(DSL)로 테스트 코드를 구현하는 기법을 보여준다. 흔히 쓰는 시스템 조작 API를 사용하는 대신 API 위에다 함수와 유틸리티를 구현한 후 그 함수와 유틸리티를 사용한다.

이렇게 구현한 함수와 유틸리티는 테스트 코드에서 사용하는 특수 API가 된다.

즉, 나중에 테스트를 읽어볼 독자를 도와주는 테스트 언어이다.

[리팩토링한 테스트 코드] 중 도메인에 특화된 테스트 코드 예
- assertResponseIsXML => 기존 JUnit API의 assertEquals를 사용하는 것을 넘어 Response가 XML인지 검사하는 도메인에 특화된 테스트 코드로 발전함
- assertResponseContains => 기존 JUnit API의 assertSubString을 사용하는 것을 넘어 Response가 특정 스트링값들을 포함하는지 검사하는 도메인에 특화된 테스트 코드로 발전함

이중 표준

테스트 API 코드에 적용하는 표준은 실제 코드에 적용하는 표준과 확실히 다르다. 단순하고, 간결하고, 표현력이 풍부해야 하지만, 실제 코드만큼 효율적일 필요는 없다. 실제 환경이 아니라 테스트 환경에서 돌아가는 코드이기 때문이다.

다음은 환경 제어 시스템에 속한 테스트 코드다. 온도가 '급격하게 떨어지면' 결보, 온풍기, 송풍기가 모두 가동되는지 확인하는 코드이다.

리팩터링 하기 전 코드

@Test
public void turnOnLoTempAlarmAtThreashold() throws Exception {
  hw.setTemp(WAY_TOO_COLD); 
  controller.tic(); 
  assertTrue(hw.heaterState());   
  assertTrue(hw.blowerState()); 
  assertFalse(hw.coolerState()); 
  assertFalse(hw.hiTempAlarm());       
  assertTrue(hw.loTempAlarm());
}

=> 위 코드는 점검하는 상태 이름과 상태 값을 확인하느라 눈길이 이리저리 흩어진다. heaterState라는 상태를 보고서는 왼쪽으로 눈길을 돌려 assertTrue를 읽는다(아래도 똑같이 행동 반복). 따분하고 미덥잖다. 테스트 코드를 읽기가 어렵다.

리팩토링한 코드

@Test
public void turnOnCoolerAndBlowerIfTooHot() throws Exception {
  tooHot();
  assertEquals("hBChl", hw.getState()); 
}
  
@Test
public void turnOnHeaterAndBlowerIfTooCold() throws Exception {
  tooCold();
  assertEquals("HBchl", hw.getState()); 
}

@Test
public void turnOnHiTempAlarmAtThreshold() throws Exception {
  wayTooHot();
  assertEquals("hBCHl", hw.getState()); 
}

@Test
public void turnOnLoTempAlarmAtThreshold() throws Exception {
  wayTooCold();
  assertEquals("HBchL", hw.getState()); 
}

=> 대문자는 켜짐(on)이고, 소문자는 꺼짐(off)을 뜻한다. 문자는 항상 {heater, blower, cooler, hi-temp-alarm, lo-temp-alarm} 순서다. => 그릇된 정보를 피하라의 규칙 위반에 가깝지만 여기서는 적절해 보인다. 일단 의미만 안다면 눈길이 문자열을 따라 움직이며 결과를 재빨리 판단한다. => 빠르게 판단되고 이해하기 쉽다는 면에서 가독성이 높은 코드이다.

hw.getState()는 실제 프로덕션 객체의 메소드가 아닌 MockControlHardware의 메소드이다. 위 코드처럼 읽기 쉬운 테스트를 하기 위해 가짜 객체에 만든 메소드다.

MockControlHardware.java

public String getState() {
    String state = "";
    state += heater ? "H" : "h";
    state += blower ? "B" : "b";
    state += cooler ? "C" : "c";
    state += hiTempAlarm ? "H" : "h";
    state += loTempAlarm ? "L" : "l";
    return state;
}

=> 이렇게 StringBuffer를 사용하지 않고 직접 스트링을 연결하는 것은 코드가 직관적이지만 메모리에 효율적이지 않다. 하지만 StringBuffer를 사용하면 메모리에 효율적이지만 테스트 코드가 직관적이지 않다.

무엇을 택해야할까?

저자는 StringBuffer를 택하지 않고 단순히 문자열을 연결하는 방식을 권한다. 왜냐하면 테스트 코드, 테스트 환경은 자원이 제한적일 가능성이 낮기 때문이다. 이것이 이중 표준의 본질이다. 실제 환경에서는 절대로 안 되지만, 테스트 환경에서는 전혀 문제없는 방식이 있다. 대개 메모리나 CPU 효율과 관련 있는 경우다. 코드의 깨끗함과는 철저히 무관하다.

테스트 당 assert 하나

JUnit으로 테스트 코드를 짤 때는 함수마다 assert 문을 단 하나만 사용해야 한다고 주장하는 학파가 있다.

assert 문이 단 하나인 함수는 결론이 하나라서 코드를 이해하기 쉽고 빠르다.

이전 testGetPageHieratchyAsXml() 테스트 메소드만 보아도 "출력이 XML이다."라는 assert 문과 "특정 문파열을 포함한다"는 assert 문을 하나로 병합하는 방식이 불합리해 보인다.

그래서 이는 테스트를 두 개로 쪼개 각자가 assert를 수행하면 된다.

public void testGetPageHierarchyAsXml() throws Exception { 
  givenPages("PageOne", "PageOne.ChildOne", "PageTwo");
  
  whenRequestIsIssued("root", "type:pages");
  
  thenResponseShouldBeXML(); 
}

public void testGetPageHierarchyHasRightTags() throws Exception { 
  givenPages("PageOne", "PageOne.ChildOne", "PageTwo");
  
  whenRequestIsIssued("root", "type:pages");
  
  thenResponseShouldContain(
    "<name>PageOne</name>", "<name>PageTwo</name>", "<name>ChildOne</name>"
  ); 
}

함수 이름을 바꿔 gien-when-then이라는 관례를 사용했다는 사실에 주목한다. 그러면 테스트 코드를 읽기가 쉬워진다.

TEMPLATE METHOD 패턴을 사용하면 중복을 제거할 수 있다. given/when 부분을 부모 클래스에 두고 then 부분을 자식 클래스에 두면 된다. 아니면 완전히 독자적인 테스트 클래스를 만들어 @Before 함수에 given/when 부분을 넣고 @Test 함수에 then 부분을 넣어도 된다.

지은이는 대체로 단일 assert를 지원하는 언어로 만들려 노력한다. 하지만 때로는 주저 없이 함수 하나에 여러 assert 문을 넣기도 한다. 단지 assert 문 개수는 최대한 줄여야 좋다는 생각이라고 한다.

테스트 당 개념 하나

어쩌면 "테스트 함수마다 한 개념만 테스트하라"는 규칙이 더 낫겠다. 이것저것 잡다한 개념을 연속으로 테스트하는 긴 함수는 피한다. 만약 여러 개념을 한 함수로 몰아넣으면 독자가 각 절이 거기에 존재하는 이유와 각 절이 테스트하는 개념을 모두 이해해야 한다.

addMonth() 메서드를 테스트하는 장황한 코드

public void testAddMonths() {
  SerialDate d1 = SerialDate.createInstance(31, 5, 2004);

  SerialDate d2 = SerialDate.addMonths(1, d1); 
  assertEquals(30, d2.getDayOfMonth()); 
  assertEquals(6, d2.getMonth()); 
  assertEquals(2004, d2.getYYYY());
  
  SerialDate d3 = SerialDate.addMonths(2, d1); 
  assertEquals(31, d3.getDayOfMonth()); 
  assertEquals(7, d3.getMonth()); 
  assertEquals(2004, d3.getYYYY());
  
  SerialDate d4 = SerialDate.addMonths(1, SerialDate.addMonths(1, d1)); 
  assertEquals(30, d4.getDayOfMonth());
  assertEquals(7, d4.getMonth());
  assertEquals(2004, d4.getYYYY());
}

각각의 절은 다음과 같은 기능을 수행한다.

(5월처럼) 31일로 끝나는 달의 마지막 날짜가 주어지는 경우
1. (6월처럼)30일로 끝나는 한 달을 더하면 날짜는 30일이 되어야지 31일이 되어서는 안 된다.
2. 두 달을 더하면 그리고 두 번째 달이 31일로 끝나면 날짜는 31일이 되어야한다.
(6월처럼) 30일로 끝나는 달의 마지막 날짜가 주어지는 경우
1. 31일로 끝나는 한 달을 더하면 날짜는 30일이 되어야지 31일이 되면 안된다.

각 절에 assert 문이 여럿이라는 사실이 문제가 아니다. 한 테스트 함수에서 여러 개념을 테스트한다는 사실이 문제다. 독자적인 개념 세 개를 테스트하므로 독자적인 테스트 세 개로 쪼개야 마땅하다.

F.I.R.S.T

깨끗한 테스트는 다음 다섯 가지 규칙을 따르는데, 각 규칙에서 첫 글자를 따오면 FIRST가 된다.

빠르게(Fast)

테스트는 빨라야 한다. 테스트가 느리면 자주 돌릴 엄두를 못 낸다. 결국 코드 품질이 망가지기 시작한다.

독립적으로(Indepent)

각 테스트는 서로 의존하면 안 된다. 한 테스트가 다음 테스트가 실행될 환경을 준비해서는 안 된다. 각 테스트는 독립적으로 그리고 어떤 순서로 실행해도 괜찮아야 한다.

반복가능하게(Repeatable)

테스트는 어떤 환경(실제 환경, QA 환경, 네트워크에 연결되지 않은 환경)에서도 반복 가능해야 한다. 테스트가 돌아가지 않는 환경이 하나라도 있다면 테스트가 실패한 이유를 둘어낼 변명이 생긴다.

자가검증하는(Self-Validating)

테스트는 부울(bool)값으로 결과를 내야 한다. 성공 아니면 실패다. 통과 여부를 알려고 로그 파일을 읽게 만들어서는 안 된다. 테스트가 스스로 성공과 실패를 가늠하지 않는다면 판단은 주관적이 되며 지루한 수작업 평가가 필요하게 된다.

적시에(Timely)

테스트는 적시에 작성해야 한다. 단위 테스트는 테스트하려는 실제 코드를 구현하기 직전에 구현한다. 실제 코드를 구현한 다음에 테스트 코드를 만들면 실제 코드가 테스트하기 어렵다는 사실을 발견할지도 모른다.

Previous8장 경계 Next모던 자바 인 액션

Last updated 3 years ago