+ All Categories

Home > Technology > Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Date post:	11-Nov-2014
Category:	Technology
Upload:	cs-ncstate
View:	5,042 times
Download:	3 times

Download Report this document

Share this document with a friend

Description:

A talk to ASE 2007 by Jamie Andrews, Felix C. H. LiDepartment of Computer ScienceUniversity of Western Ontario; and Tim MenziesLane Department of Computer ScienceWest Virginia University

Embed Size (px):

37

Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator Jamie Andrews and Felix C. H. Li Department of Computer Science University of Western Ontario Tim Menzies Lane Department of Computer Science West Virginia University

Transcript

Page 1: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Nighthawk:A Two-Level Genetic-Random

Unit Test Data Generator

Jamie Andrewsand Felix C. H. Li

Department of Computer ScienceUniversity of Western Ontario

Tim MenziesLane Department of Computer Science

West Virginia University

Page 2: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 2

Plan of Talk• Randomized Unit Testing• Genetic Algorithms (GA)• Nighthawk: randomized testing level• Nighthawk: GA level• Empirical studies

Page 3: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 3

Randomized Testing

• Generate inputs using randomization

• Challenges:– Thoroughness?– Test oracle?

Page 4: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 4

Effectiveness of Randomized Testing

• Analysis:– Duran & Ntafos, Hamlet & Taylor, Jeng &

Weyuker, ...

• Empirical:– Miller (Fuzz, 1990s), Claessen & Hughes

(QuickCheck, 2000), Andrews (ASE 2004), Pacheco et al., Groce et al. (ICSE 2007)

• Why?– Generate many different test inputs cheaply– Effective and thorough if set up right

Page 5: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 5

Unit Testing

• Test case = seq of method calls

• Each call possibly:– Preceded by

argument setup– Followed by

result evaluation

TreeMap t = new TreeMap();Employee e = new

Employee("W");t.put(e, 43);t.remove(e);assert t.size() == 0;

How many TreeMaps to

store?

When to reuse

TreeMaps?

Page 6: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 6

Randomized Unit Testing

• Randomization of:– Methods called– Arguments selected

• Challenges:– Test oracle – JML, Java assertions, ...– Thoroughness?

Page 7: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 7

Example: TreeMap

• Create pool of n Employees• Randomly put(), remove() Employees• n=10000: remove() usually fails at

first– Doesn't cover emptying out tree

• n=2: tree doesn't get big– Doesn't cover many branches

• n=30: "just right"

Page 8: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 8

Genetic Algorithms (GA)

• Chromosomes encode solutions

Page 9: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 9

Genetic Algorithms (GA)

• Mutation

Page 10: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 10

Genetic Algorithms (GA)

• Recombination

Page 11: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 11

Genetic Algorithms (GA)

• Fitness function chooses "survivors"

Page 12: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 12

GAs and Testing

• Evolving individual test cases:– Guo et al., FATES 2003– Tonella, ISSTA 2004

Page 13: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 13

Nighthawk:Randomized Testing Level• Input: set M of target methods;

chromosome c• Output: fitness of chromosome• Algorithm overview: select and

run one randomized unit test case, measure coverage

• Random choices partly controlled by chromosome c

Page 14: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 14

Randomized Testing Level: Details

• Populate "value pools" for every relevant class

• Repeat L times:– Choose target method "randomly"– Choose receiver, params "randomly"

from value pools– Call method– Place return value in value pool

Page 15: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 15

Value Pools and MethodsTreeMap intEmployee

..

.. ..

. ..

. ..

..

.. ...

. . .

...

t.put(e, i);

"value reuse policy"

Page 16: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 16

GA Level: Chromosomes

• Chromosome = set of genes• Each gene controls aspect of

randomized testing algorithm

Page 17: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 17

Genes

• Genes answer questions like:– How long is the test case?– How often do we choose method m?– How many value pools?– How do we construct int value pools?– What is the value reuse policy?

• Where do I get this parameter from?• Where do I put the result value?

Page 18: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 18

Initialization

Page 19: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 19

Cloning

Page 20: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 20

Mutation, Recombination

Page 21: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 21

Fitness Evaluation

43244300 4288 369635593331 32783277 3000

Page 22: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 22

Sorting

4324 4300 4288 3696 3559 3331 3278 3277 3000

Page 23: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 23

Retention

4324 4300 4288

Page 24: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 24

Fitness Function

(number of lines covered) * 1000- (number of method calls)

brake on test case length

reward for high coverage

Page 25: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 25

Empirical Evaluation

• Comparison to previous studies• Case study: Collection and Map

classes• Comparison of option settings

Page 26: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 26

Comparison to Previous Studies

• Compared to:– Michael et al. TSE 2001: straight GA– Visser et al. ISSTA 2006: JPF with state

matching– Pacheco et al. ICSE 2007: extending test

sequences randomly

• Achieved same coverage when run with same constraints

• Achieved more coverage when run with no constraints

Page 27: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 27

Case Study: java.util

• Applied Nighthawk to all 16 Collection and Map classes from java.util 1.5.0

• Measured line coverage, clock time• Compared option settings

Page 28: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 28

Results – Coverage (Lines)

Source SLOC PN EN PD ED

ArrayList

150 111 140 109 140 (.93)

EnumMap

239 7 9 10 7 (.03)

HashMap

360 238 265 305 347 (.96)

HashSet 46 24 40 26 44 (.96)

Hashtable

355 205 253 252 325 (.92)

...

Enriched test wrappers Deep target analysis Both

Page 29: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 29

Results – Time (Clock Sec.)

Source PN EN PD ED

ArrayList

75 91 29 48

EnumMap

3 9 6 5

HashMap

63 37 136 176

HashSet 25 29 27 39

Hashtable

8 110 110 157

...

Page 30: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 30

Results - Analysis

• Enriched wrappers, Deep analysis better– Overall coverage 82% of lines

• Deep analysis also took longer– Still less than 100 sec/class avg

• EnumMap (3%): constructor expects enumerated type– Customized wrapper:

• 85% coverage of EnumMap• Raises overall coverage to 88%

Page 31: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 31

Conclusions

• Metaheuristic search can find effective parameters for randomized testing

• Only needs info about methods and parameter types

• Efficiency acceptable

Page 32: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 32

Future Work

• Which metaheuristic search approach?– Genetic algorithms– Simulated annealing ...

• Which genes are really necessary?• Which coverage criterion?

Page 33: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 33

Thank you!

Page 34: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 34

Oracle: Test Wrapper Class

• Test wrapper class: methods that call methods of target class

public class TreeMapTestWrapper { private TreeMap target; ... void put(Object key, Object value) { // insert preconditions target.put(key, value); // insert oracle assertions} }

Page 35: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 35

Enriched (E) Test Wrappers

• Add methods to test:– Serialization– Typed equals()

• Typically cover more code

Page 36: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 36

Normal (N) Target Analysis

• Red = call all methods• Green = call only constructors

B: Classes ofparams of A methods

A: Classes named by user

All classes

Page 37: Nighthawk: A Two-Level Genetic-Random Unit Test Data Generator

Andrews -- ASE 2007 -- Atlanta Nov. 8 37

Deep (D) Target Analysis

• Red = call all methods• Green = call only constructors

B: Classes ofparams of A methods

C: Classes ofparams of B methods

A: Classes named by user

All classes

Recommended

ZUC Random Number Generator

Random Number Generator

Cryptanalysis of the Windows Random Number Generator

Random Bit Generator Using Chua

Random Password Generator in c

Random Number Generator Andy Chen

DESIGN AND ANALYSIS OF RANDOM NUMBER GENERATOR

Random Number Generator (RNG) for Microcontrollers

Validating a Random Number Generator

D20 Master Kit - Random Fantasy Adventure Generator

Random Number Generator Recommendations for Applications

Pseudo Random Bit Generator

A Fast and Compact Quantum Random Number Generator · A Fast and Compact Quantum Random Number Generator ... make it distinguishable from all ... random generator the autocorrelation

Qualcomm Pseudo Random Number Generator Version 2.1.0 and ... · Qualcomm Pseudo Random Number Generator hardware 2.1.0 Qualcomm Pseudo Random Number Generator hardware 2.3.1 Table

CPU Time Jitter Based Non-Physical True Random Number Generator · 2015. 1. 13. · 24 CPU Time Jitter Based Non-Physical True Random Number Generator 3.The random number generator

Random Number Generator - Renesas Electronics€¦ · Random Number Generator Random Numbers generated by Software 1 Introduction This application note describes how to generate a

Pseudo Random Pattern Generator- Report

RANDOM CHALLENGE GENERATOR