Korean Journal of Medicinal Crop Science
[ ARTICLE ]
Korean Journal of Medicinal Crop Science - Vol. 25, No. 6, pp.411-417
ISSN: 1225-9306 (Print) 2288-0186 (Online)
Print publication date Dec 2017
Received 5 Sep 2017 Revised 29 Sep 2017 Reviewed 20 Oct 2017 Reviewed 30 Oct 2017 Accepted 31 Oct 2017
DOI: https://doi.org/10.7783/KJMCS.2017.25.6.411

차세대염기서열분석법을 이용한 잔대의 SSR 마커 개발

박기찬* ; 김영국* ; 황보경** ; 길진수** ; 정희** ; 박신기*** ; 홍창표*** ; 이이**,
*농촌진흥청 국립원예특작과학원 인삼특작부
**충북대학교 특용식물학과
***㈜테라젠이텍스 바이오연구소
Development of Simple Sequence Repeat Markers from Adenophora triphylla var. japonica (Regel) H. Hara using Next Generation Sequencing
Ki Chan Park* ; Young Guk Kim* ; Kyeong Hwangbo** ; Jinsu Gil** ; Hee Chung** ; Sin Gi Park*** ; Chang Pyo Hong*** ; Yi Lee**,
*Department of Herbal Crop Research, NIHHS, RDA, Eumseong 27709, Korea.
**Department of Industrial Plant Science and Technology, Chungbuk National University, Cheongju 28644, Korea.
***Theragen Etex Bio Institute, Suwon 16229, Korea.

Corresponding author: +82-43-261-3373 leeyi22@hanmail.net

© The Korean Society of Medicinal Crop Science. All rights reserved.
This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License ( http://creativecommons.org/licenses/by-nc/3.0 ) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Abstract

Background:

Adenophora triphylla var. japonica (Regel) H. Hara shows vegetative growth with radical leaves during the first year and shows reproductive growth with cauline leaves and bolting during the second year. In addition, the shape of the plant varies within the same species. For this reason, there are limitations to classifying the species by visual examination. However, there is not sufficient genetic information or molecular tools to analyze the genetic diversity of the plant.

Methods and Results:

Approximately 34.59 Gbp of raw data containing 342,487,502 reads was obtained from next generation sequencing (NGS) and these reads were assembled into 357,211 scaffolds. A total of 84,106 simple sequence repeat (SSR) regions were identified and 14,133 primer sets were designed. From the designed primer sets, 95 were randomly selected and were applied to the genomic DNA which was extracted from five plants and pooled. Thirty-nine primer sets showing more than two bands were finally selected as SSR markers, and were used for the genetic relationship analysis.

Conclusions:

The 39 novel SSR markers developed in this study could be used for the genetic diversity analysis, variety identification, new variety development and molecular breeding of A. triphylla.

Keywords:

Adenophora triphylla, Genetic Diversity, Molecular Breeding, Next Generation Sequencing, SSR Marker

서 언

잔대 [Adenophora triphylla var. japonica (Regel) H. Hara]는 초롱꽃과에 속하는 타식성 식물이며 전 세계적으로 약 60 여 종이 분포하지만 주로 아시아권에서 자생하며 그 중 약 30 여 종이 우리나라에 자생하고 있는 것으로 알려져 있다 (Lee et al., 2006). 잔대는 같은 종이라 하더라도 개체 간에 다양한 형태적 특성을 나타내고 그 유전형질 또한 다양하다고 보고되었다 (Lee et al., 1988; Lee, 1989). 예로부터 알려진 약용식물인 잔대 (사삼)의 효능은 주로 폐 기능에 도움을 주 며, 강한 해독능력이 있다고 전해지고 있다 (Shin and Seo, 2000).

현재까지 약용식물에 대한 연구는 물질분석을 통한 이차대 사산물의 이용과 같은 성분에 대한 연구와 DNA barcode기법 을 통한 종판별이나 randomly amplified polymorphic DNA (RAPD)를 이용한 유연관계 분석 등의 연구가 주로 이루어 졌다. 최근 들어 한약재의 기원이 되는 식물에 대해 분자수준 에서의 분류학적 연구가 활발해지고 있으며 유전정보의 중요 성이 대두되면서 next generation sequencing (NGS)을 통한 유전체 분석 및 유전적 다양성분석과 이를 기초로 하는 분자 육종의 필요성이 대두되고 있다 (Eu et al., 2009; Lee et al., 2010).

분자마커는 생물마다 가지고 있는 DNA의 염기서열 정보에 기반하여 중합효소연쇄반응 (polymerase chain reaction, PCR) 결과물의 길이 차이를 비교하거나 염기서열의 차이를 이용하 여 종 혹은 집단을 비교 분석하는 방법이다. 좋은 마커의 요 건으로는 다형성을 가지고 있으며 공우성적으로 검출할 수 있 고, 대상으로 하는 식물의 유전체 전체에 고르게 분포하며 변 이를 탐색하는데 있어 저렴한 비용으로 짧은 시간에 분석이 가능할 뿐 아니라 재현성이 높게 나타나는 것이 좋다.

분자마커의 대표적인 종류로는 RAPD, restriction fragment length polymorphism (RFLP), amplified fragment length polymorphism (AFLP), single nucleotide polymorphism (SNP), simple sequence repeat (SSR) 등이 있다. 이중에서 SSR마커는 식물체의 유전체에 존재하는 단순반복 염기서열의 반복횟수의 차이를 이용하는 마커이며 다른 마커보다 다형성 정도가 높고 공우성을 나타내기 때문에 검정 계통의 이형접합 도 여부를 쉽게 확인할 수 있는 등의 장점이 있다 (McCouch et al., 1997; Coburn et al., 2002). 실제로 국제식물신품종보호 연맹 (International Union for the Protection of New Varieties of Plants, UPOV) 내의 분자생물학실 무작업반 (Working Group on Biochemical and Molecular Techniques and DNAProfiling in Particular, BMT) 내에서도 품종식별에 SSR마커가 가장 효과적임을 제안한 바 있다 (UPOV-BMT, 2002).

최근 들어 한약재의 기원이 되는 식물 종을 대상으로 분자 수준에서 식물 분류학적 측면의 연구가 많이 이루어지고 있으 며 (Eu et al., 2009; Lee et al., 2010), 종 다양성 및 종간 계통 분류학적 유연관계 분석을 위해 특정한 유전자 부위의 염 기서열이나 유전체를 이용한 DNA fingerprinting을 이용한 연 구가 다수 보고되었다 (Kress et al., 2005; Weising et al., 2005).

최근 NGS 기술의 발전은 대량의 마커 발굴을 가능하게 하 였으며 (Mardis, 2008; Wang et al., 2009), 그 결과 옥수수, 밀, 벼 등 주요 식량작물이나 채소, 화훼에서는 육종기술의 발 달과 마커의 분자 표지 개발에 관한 연구가 활발히 이루어졌 다 (Nybom, 2004; Henry, 2012; Kilian and Graner, 2012). 그러나, 약용작물의 종내 다양성에 대한 연구는 더덕 (Kim et al., 2016)과 같은 주요 약용작물을 제외하면 분자수준의 연구 가 매우 미미한 실정이다.

본 연구에서는 국내의 여러 지역에 걸쳐 자생하며 재배, 유 통되고 있는 잔대를 대상으로 NGS를 통한 SSR마커를 개발 하고 이를 이용하여 잔대의 유전적 다양성을 분석하여 향후 육종에 필요한 연구 기반을 마련하고자 수행하였다.


재료 및 방법

1. SSR 구간 탐색 및 프라이머 제작

본 실험의 NGS 분석에는 강원도 평창에서 수집된 유전자 원 PC001에 속하는 한 개체를 임의로 선택하였으며, SSR마 커의 효율성 검정과 유전다양성 분석을 위한 재료는 평창, 보 은, 임실, 진안, 나주, 곡성, 화순 등 7 개 지역에서 뿌리를 수집 후 농촌진흥청 국립원예특작과학원 인삼특작부에서 증식 한 총 23 유전자원을 사용하였다 (Table 1).

List of Adenophora triphylla genetic resources used in this study.

NGS는 Illumina Hiseq 2500 플랫폼 (Illumuna, San Diego, CA, USA)을 이용하여 수행하였으며, 이를 통해 얻은 핵산조각을 Gil 등 (2017)의 방법에 따라 SOAPdenovo2 version 2.04의 SOAPec을 이용하여 error를 보정한 후 SOAPdenovo2를 이용하여 조합하였다. Microsatellites, transposable elements, rDNAs 등과 같은 반복서열은 RepeatMasker version 4.0.5과 RepeatModeler version 1.0.8 ( http://www.repeatmasker.org/ )을 이 용하여 분석하였다. 또한 SSR Finder ( ftp://ftp.gramene.org/pub/ gramene/arch-ives/software/scripts/ssr.pl )를 사용하여 SSR 구간 을 탐색하였다. SSR 구간을 탐색하기 위해 2 가지의 변수를 고려하였다. 첫 번째는 2 개에서 6 개의 염기쌍 (base pairs) 이 직렬로 최소 5 회 이상 반복되는 염기서열을 우선 선택하였 고, 두 번째는 반복되는 motif에 변이가 있는 것은 제외하였다. Primer3 program (Untergasser et al., 2012)을 이용하여 SSR 프라이머 서열을 다음과 같은 조건에서 디자인하였다. 길이는 18 bp에서 26 bp (최적 길이 23 bp)이고 GC함량은 50%에서 70% (최적 60%)로 하였으며, Tm값은 55℃에서 62℃ (최 적 58℃)로 설정하였다. PCR product의 길이는 150 bp에서 250 bp 사이가 되게 설계하되, 프라이머쌍 사이에 서로 다른 motif의 반복구간이 들어간 것들은 모두 제외하였다.

2. 다형성 SSR 프라이머 선발

본 연구에서 수집된 유전자원 중 5 개 지역 (평창, 보은, 나주, 임실, 화순)에서 각각 1 개체씩을 임의로 선별하고 genomic DNA를 추출한 후, 이를 동량으로 혼합하는 genomic DNA pooling 방법을 이용하여 혼합된 genomic DNA를 95 개의 프라이머에 적용하였다. 그 후, Fragment Analyzer Automated CE system (Advanced Analytical Technologies, Ankeny, IA, USA) 기기를 이용하여 Quant-iT PicoGreen dsDNA reagent kit, 1-500 bp (Invitrogen Co., Carlsbad, CA, USA)로 전기영동을 수행하였다. 이후, 증폭된 밴드는 PROSize version 2.0 software (Advanced Analytical Technologies, Ankeny, IA, USA) 프로그램을 이용하여 분석 하였다. 이를 바탕으로, 결과 값이 뚜렷하고, PCR product의 증폭 길이가 예상되었던 수치와 비슷하며, 또한 2 개 이상의 밴드를 보이는 프라이머를 선별하였다.

3. SSR 마커의 효율성 검증

선발된 마커를 수집된 자원에 적용하여 개발된 마커의 효율 성을 검정하였다. 이를 위해서 선발된 프라이머를 총 23 개체 에 각각 적용하였고, 증폭된 PCR 산물을 DNA Fragment Analyzer Automated CE System (Advanced Analytical Technologies, Ankeny, IA, USA)을 이용하여 분석하였다. 그 결과를 마커 분석 프로그램인 Power Marker software (Version 3.23) (Botstein et al., 1980; Liu and Muse 2005) 를 이용하여 선발된 SSR 마커의 효율성을 분석하였다.


결과 및 고찰

1. 염기서열 분석 및 SSR 구간 탐색과 프라이머 제작

본 연구에서는 Illumina Hiseq 2500 platform을 이용하여 염기서열 분석을 수행하였다. Paired-end sequencing 방법을 이용하여 총 342,487,502 개의 read를 포함하는 총 34.59 Gbp의 염기서열 정보를 생산하였고, GC의 비율은 41.37% 였다. 생산된 염기서열로부터 총 357,211 개의 scaffold를 얻 었고, N50은 1,459 bp였다.

이렇게 얻어진 scaffold로부터 SSR 구간을 검색하고 primer 를 제작하였다. 검색된 SSR구간은 총 84,106 개로 assembly 된 전체 염기서열의 0.73%를 차지하였으며, 그 중 dinucleotide가 70,497 개, tri-nucleotide가 9,998 개, tetranucleotide가 1,263 개, penta-nucleotide가 752 개, hexanucleotide가 757 개, hepta-nucleotide가 87 개를 차지하였다 (Table 2, Table 3).

Details of the repeat search from the Adenophora triphylla PC001 whole genome assembly.

SSR motif types of Adenophora triphylla.

탐색된 SSR 구간에서 서로 다른 SSR motif가 없도록 14,133 개의 SSR 프라이머를 설계하였으며, 이 중에서 임의로 tri-nucleotide 31 개, tetra-nucleotide 40 개, penta-nucleotide 24 개를 포함한 총 95 개의 프라이머 세트를 제작하였다.

2. 다형성을 보이는 SSR 프라이머 선발

제작된 95 개의 프라이머 세트 중 5 개체를 이용하여 다형 성을 조사한 결과 총 39 개의 프라이머 세트가 선발되었다 (Table 4). 선발된 39 개의 프라이머 세트를 이용하여 23 개 의 자원에서 유전적 다양성을 분석한 결과 allele의 수가 2 개 에서 12 개로 나타나 명확한 다형성을 보였으며 (Table 5), 이 SSR 프라이머 세트는 잔대 [Adenophora triphylla var. japonica (Regel) H. Hara]의 SSR 마커로 활용하기에 매우 적합하다고 판단되었다. 이들 마커의 motif 종류는 tri motif 11 개, tetra motif 17 개, penta motif 11 개 였으며, 결과적 으로 motif 별로 고르게 마커가 개발되었음을 알 수 있었다.

Characteristics of the SSR markers developed from Adenophora triphylla.

3. SSR 마커의 효율성 검증

개발된 마커의 효율성을 검증하기 위하여 23 개체에 적용하 여 얻은 총 263 개의 allele을 분석하였다. Frequency of major alleles (MAF)은 0.17 - 0.87 (평균 0.46) 이었고, genotype number (GN)는 의 값은 2 - 18 (평균 9.9)였으며, heterozygosity (HE)는 0.23 - 0.88 (평균 0.68)이었다. Observed heterozygosity (HO)의 값은 0.24 - 1.00 (평균 0.59)였으며, polymorphism information content (PIC)의 값은 0.20 - 0.87 (평균 0.64)이었 다. PIC 값이 가장 컸던 마커는 Atri00959였으며, 이 마커는 PIC값과 HE 뿐만 아니라 GN도 높게 나타났다 (Table 5). 위 결과를 바탕으로 적용된 39 개의 마커는 잔대의 유전자원 분 석에 적합하다고 사료되었다.

Genetic diversity measures for 39 polymorphic SSR loci using 23 Adenophora triphylla accessions.

39 개의 SSR마커를 이용하여 얻은 결과를 바탕으로 국내 각 지역에서 수집된 잔대 유전자원 23 개에서 유전자형을 분 석하여 계통학적 분석을 한 결과 수집지역별로 그룹이 만들어 지지 않고 섞여서 만들어지는 것을 알 수 있었다 (Fig. 1). 또 한, 한 지역에서 수집된 자원이라도 다시 세부 그룹으로 나뉘 어져, 잔대는 유전적으로 다양하다는 것을 잔대 유전체 정보 를 바탕으로 개발된 SSR 마커를 이용하여 확인할 수 있었다. 또한, 개발된 마커의 평균 PIC 값이 0.64인 것으로 볼 때 본 연구에서 개발된 잔대의 SSR 마커는 유전자형의 다양성을 확 인하는데 우수한 마커임을 알 수 있었다.

Fig. 1

Phylogenetic tree for 23 Adenophora triphylla collections using 39 SSR markers.PC; Gangwondo Pyeongchang-gun 2015, BE; Chungcheongbukdo Boeun-gun 2015, IS; Jeollabuk-do Imsil-gun 2016, JA; Jeollabuk-do Jinan-gun 2015, NJ; Jeollanam-do Naju-si 2016, GS; Jeollanam-do Gokseong-gun 2015, HS; Jeollanam-do Hwasungun 2016. The genetic distances between strains were calculated based on the shared allelic methods (Jin and Chakraborty, 1994) using PowerMarker v3.25 software. The values on each branch indicate the length of the branch. The scale bar indicates the branch length.

지금까지 잔대 (사삼)에서는 항산화와 비만 등에 관련된 성 분물질 분석, 약리활성에 대한 연구가 꾸준하게 이루어져 왔 지만 (Lee et al., 2015; Kim, 2016), 잔대의 유전적 다양성 이나 신품종 육성을 위한 유전적 연구는 RAPD나 DNA barcoding 등을 통해 이루어진 속간 유연관계의 포괄적인 규 명에 국한되었고, 더구나 잔대속의 경우 속간 유전적 분자표 지의 연구나 종내 다양성에 대한 연구는 매우 한정적이어서 (Eddie et al., 2003; Cheon and Yoo, 2013), 확보한 잔대 유전자원의 다양성 확인 및 체계적 관리, 계통 분류 등에 많 은 어려움이 있었다.

본 연구에서 개발된 SSR 마커는 잔대의 유전체 정보를 기 반으로 한 것으로써, 잔대의 유전적 다양성을 염기서열 수준 에서 밝히는데 매우 유용하다는 것을 알 수 있었다. 또한, 이 를 이용하여 국내 잔대 유전자원의 다양성을 성공적으로 파악 함으로써, 잔대의 체계적인 계통 분류 및 분자 육종에 필요한 기본적 자료를 제공하였다. 본 연구에서 개발된 마커는 앞으 로 국내외 잔대 유전자원의 확보 및 다양성 분석, 우수 형질 의 잔대 품종 개발에도 도움을 줄 것으로 사료된다.

감사의 글

본 연구는 농촌진흥청 연구사업(과제번호: PJ0102882017, PJ01102202)의 지원에 의해 이루어진 것으로 이에 감사드립 니다.

References

  • D. Botstein, R.L. White, M. Skolnick, R.W. Davis, Construction of a genetic linkage map in man using restriction fragment length polymorphisms., Am. J. Hum. Genet, (1980), 32, p314-331.
  • K.S. Cheon, K.O. Yoo, Phylogeny of Hanabusaya (Campanulaceae), a Korean endemic, based on ITS sequences of nuclear ribosomal DNA., J. Syst. Evol, (2013), 51, p704-714. [https://doi.org/10.1111/jse.12039]
  • J.R. Coburn, S.V. Temnykh, E.M. Paul, S.R. McCouch, Design and application of microsatellite marker panels for semiautomated genotyping of rice(Oryza sativa L.)., Crop Sci, (2002), 42, p2092-2099.
  • W.M. Eddie, T. Shulkina, J. Gaskin, R.C. Haberle, R.K. Jansen, Phylogeny of Campanulaceae S. Str. inferred from ITS sequences of nuclear ribosomal DNA., Ann. Mo. Bot. Gard, (2003), 90, p554-575. [https://doi.org/10.2307/3298542]
  • G.S. Eu, M.R. Park, S.J. Yun, Internal transcribed spacer(ITS) regions reveals phylogenic relationships of Rubus species cultivated in Korea., Hanguk Yakyong Changmul Hakhoe Chi, (2009), 17, p165-172.
  • J. Gil, Y. Um, S. Kim, O.T. Kim, S.C. Koo, C.S. Reddy, S.C. Kim, C.P. Hong, S.G. Park, H.B. Kim, D.H. Lee, B.H. Jeong, J.W. Chung, Y. Lee, (2017), Development of genome-wide SSR markers from Angelica gigas Nakai using next generation sequencing., Genes, 8, p238, http://www.mdpi.com/2073-4425/8/10/238/htm. [https://doi.org/10.3390/genes8100238]
  • R.J. Henry, Next-generation sequencing for understanding and accelerating crop domestication., Brief. Funct. Genomics, (2012), 11, p51-56. [https://doi.org/10.1093/bfgp/elr032]
  • L. Jin, R. Chakraborty, Estimation of genetic distance and coefficient of gene diversity from single-probe multilocus DNA fingerprinting data., Mol. Biol. Evol, (1994), 11, p120-127.
  • B. Kilian, A. Graner, NGS technologies for analyzing germplasm diversity in genebanks., Brief. Funct. Genomics, (2012), 11, p38-50. [https://doi.org/10.1093/bfgp/elr046]
  • H.K. Kim, Adenophora remotiflora protects human skin keratinocytes against UVB-induced photo-damage by regulating antioxidative activity and MMP-1 expression., Nutr. Res. Pract, (2016), 10, p371-376. [https://doi.org/10.4162/nrp.2016.10.4.371]
  • S. Kim, J.H. Jeong, H. Chung, J.H. Kim, J. Gil, J. Yoo, Y. Um, O.T. Kim, T.D. Kim, Y.Y. Kim, D.H. Lee, H.B. Kim, Y. Lee, Simple sequence repeat marker development from Codonopsis lanceolata and genetic relation analysis., J. Plant Biotechnol, (2016), 43, p181-188.
  • W.J. Kress, K.J. Wurdack, E.A. Zimmer, L.A. Weigt, D.H. Janzen, Use of DNA barcodes to identify flowering plants., Proc. Natl. Acad. Sci. USA, (2005), 102, p8369-8374. [https://doi.org/10.1073/pnas.0503123102]
  • D.R. Lee, Y.S. Lee, B.K. Choi, H.J. Lee, S.B. Park, T.M. Kim, H.J. Oh, H.Y. Yang, J.W. Suh, Roots extracts of Adenophora triphylla var. japonica improve obesity in 3T3-L1 adipocytes and high-fat diet-induced obese mice., Asian Pac. J. Trop. Med, (2015), 8, p898-906.
  • J.H. Lee, I.H. Jo, J.W. Lee, C.G. Park, K.H. Bang, H.S. Kim, C.B. Park, Molecular authentication of Scrophularia herbs by PCR-RFLP based on rpl-5 region of mitochondrial DNA., Hanguk Yakyong Changmul Hakhoe Chi, (2010), 18, p173-179.
  • J.K. Lee, Taxonomy of the genus Adenophora (Adenophorae) in Korea. Master Thesis, (1989), Sungkyunkwan University.
  • S.T. Lee, Y.J. Chung, J.K. Lee, A palynotaxonomic study of the Korean Campanulaceae., Korean J. Plant Taxon, (1988), 18, p115-131. [https://doi.org/10.11110/kjpt.1988.18.2.115]
  • S.Y. Lee, S.K. Lee, J.K. Lee, K.H. Kim, S.K. Lee, Cultural characteristics and genetic diversity of Rhizina undulata isolates by random amplified polymorphic DNA(RAPD)., J. Korean For. Soc, (2006), 95, p388-392.
  • K.J. Liu, S.V. Muse, PowerMarker: An integrated analysis environment for genetic marker analysis., Bioinformatics, (2005), 21, p2128-2129. [https://doi.org/10.1093/bioinformatics/bti282]
  • E.R. Mardis, Next-generation DNA sequencing methods., Annu. Rev. Genomics Hum. Genet, (2008), 9, p387-402.
  • S.R. McCouch, X. Chen, O. Panaud, S. Temnykh, Y. Xu, Y.G. Cho, N. Huang, T. Ishii, M. Blair, Microsatellite marker development, mapping and applications in rice genetics and breeding., Plant Mol. Biol, (1997), 35, p89-99.
  • H. Nybom, Comparison of different nuclear DNA markers for estimating intraspecific genetic diversity in plants., Mol. Ecol, (2004), 13, p1143-1155. [https://doi.org/10.1111/j.1365-294x.2004.02141.x]
  • D.H. Shin, Y.B. Seo, Bibliographical studies on the shashen(Adenophora triphylla var. japonica Hara.)., Journal of Daejeon Oriental Medicine, (2000), 8, p107-122.
  • A Untergasser, I Cutcutache, T Koressaar, J Ye, BC Faircloth, M Remm, SG Rozen, (2012), Primer3-new capabilities and interfaces. [https://doi.org/10.1093/nar/gks596]
  • UPOV-BMT, C/36/10 Progress report of the 36th session of the technical committee, the technical working parties and working group on biochemical and molecular techniques and DNA-profiling in particular, (2002), Geneva, Switzerland.
  • Z. Wang, M. Gerstein, M. Snyder, RNA-Seq: A revolutionary tool for transcriptomics., Nat. Rev. Genet, (2009), 10, p57-63. [https://doi.org/10.1038/nrg2484]
  • K. Weising, H. Nybom, K. Wolff, G. Kahl, DNA fingerprinting in plants: Principles, methods, and applications, 2nd ed, Boca Raton, FL, USA, CRC Press, (2005), p21-146.

Fig. 1

Fig. 1
Phylogenetic tree for 23 Adenophora triphylla collections using 39 SSR markers.PC; Gangwondo Pyeongchang-gun 2015, BE; Chungcheongbukdo Boeun-gun 2015, IS; Jeollabuk-do Imsil-gun 2016, JA; Jeollabuk-do Jinan-gun 2015, NJ; Jeollanam-do Naju-si 2016, GS; Jeollanam-do Gokseong-gun 2015, HS; Jeollanam-do Hwasungun 2016. The genetic distances between strains were calculated based on the shared allelic methods (Jin and Chakraborty, 1994) using PowerMarker v3.25 software. The values on each branch indicate the length of the branch. The scale bar indicates the branch length.

Table 1

List of Adenophora triphylla genetic resources used in this study.

No. Collection ID Collection region Collection year

NGS; Used for next generation sequencing.
1 PC001 [NGS1)] Gangwon-do, Pyeongchang-gun 2015
2 PC002 Gangwon-do, Pyeongchang-gun 2015
3 PC003 Gangwon-do, Pyeongchang-gun 2015
4 PC004 Gangwon-do, Pyeongchang-gun 2015
5 BE001 Chungcheongbuk-do, Boeun-gun 2015
6 BE002 Chungcheongbuk-do, Boeun-gun 2015
7 BE003 Chungcheongbuk-do, Boeun-gun 2015
8 IS006 Jeollabuk-do, Imsil-gun 2016
9 IS009 Jeollabuk-do, Imsil-gun 2016
10 IS012 Jeollabuk-do, Imsil-gun 2016
11 IS016 Jeollabuk-do, Imsil-gun 2016
12 JA001 Jeollabuk-do, Jinan-gun 2015
13 JA002 Jeollabuk-do, Jinan-gun 2015
14 JA003 Jeollabuk-do, Jinan-gun 2015
15 NJ001 Jeollanam-do, Naju-si 2016
16 NJ002 Jeollanam-do, Naju-si 2016
17 NJ003 Jeollanam-do, Naju-si 2016
18 NJ004 Jeollanam-do, Naju-si 2016
19 GS002 Jeollanam-do, Gokseong-gun 2015
20 GS003 Jeollanam-do, Gokseong-gun 2015
21 HS001 Jeollanam-do, Hwasun-gun 2016
22 HS007 Jeollanam-do, Hwasun-gun 2016
23 HS008 Jeollanam-do, Hwasun-gun 2016

Table 2

Details of the repeat search from the Adenophora triphylla PC001 whole genome assembly.

Type Number of elements Length (bp) In genome (%)

SINEs; Short interspersed nuclear elements, LINEs; Long interspersed nuclear elements, LTR; Long terminal repeat, RC; Rolling-circle.
Retrotransposons 271,852 51,826,041 11.38
SINEs 9,922 1,139,203 0.25
LINEs 28,230 5,370,052 1.18
LTR elements 233,700 45,320,139 9.95
DNA transposons 123,770 16,890,297 3.71
DNA 120,710 16,345,389 3.59
RC 3,060 561,985 0.12
Unclassified 772,971 100,313,631 22.03
Simple sequence repeats 84,106 3,316,165 0.73
Low complexity 15,057 720,565 0.16
Total 170,626,675 37.47

Table 3

SSR motif types of Adenophora triphylla.

Repeat type No. of searched SSR In SSR (%) No. of primer designed SSR In SSR (%) No. of tested SSR

Di 70,497 84.58 11,785 14.14 NT
Tri 9,998 11.99 1,899 2.28 31
Tetra 1,263 1.52 222 0.27 40
Penta 752 0.90 117 0.14 24
Hexa 757 0.91 102 0.12 NT
Hepta 87 0.10 8 0.01 NT
Total 83,354 100 14,133 16.96 95

Table 4

Characteristics of the SSR markers developed from Adenophora triphylla.

No. Primer ID SSR motif Tm (℃) Allele size range (bp) Primer sequences (5’-3’) GenBank accession No.

1 Atri00004 AAAC(6) 59 149-229 F :AGCAGAGTTCGTACAGGTTCC KY906103
R :GGGGCTCAAATACCACTTGT
2 Atri00007 AAAG(5) 59 181-193 F :CGTTCCGCCGATACTAGTTACA KY906104
R :GACATGACATCAGTTCCACG
3 Atri00011 AAAG(8) 59 179-199 F :CTCACATCTTACGAGCCTCTCT KY906105
R :GGTTGCTTTCTCCTGGAATG
4 Atri00021 AAAT(5) 58 200-212 F :GGGCATAGCTCTCTGCTTAGT KY906106
R :GACTGAAGATCTGAAGGTCACG
5 Atri00048 ACAG(5) 58 168-204 F :GCATACTAGGCCACTGATTCC KY906107
R :GCAGTCTCCACTTCTTATAGGC
6 Atri00051 ACCT(5) 59 168-184 F :GTACCCTCTGCGAAGATAACG KY906108
R :ATGAGTCCAATAGCCCTAGCTC
7 Atri00079 ATTT(5) 58 146-162 F :GGCAGAGTATTAGGTGAACTGG KY906109
R :TGTGAGGAGAGACAGAGGTAGTG
8 Atri00095 CCAG(5) 57 132-164 F :AACCACTGAGCTTCTTCGAG KY906110
R :CTTTCTCAGCTAGGTTCTCAGC
9 Atri00108 CTCA(5) 58 200-232 F :CATTGATGAGCTCTCGAACC KY906111
R :CAATGCCTGTAGTTTGGTCC
10 Atri00111 CTCC(5) 59 167-199 F :GCTAAGGCGCAGGTATTATGAC KY906112
R :GATGGTGCATGTGACTCAAG
11 Atri00146 GCTA(5) 59 179-203 F :CATAGCTGAGCTGGTGAACAGT KY906113
R :ATTCATCTCCCCACCTTCAG
12 Atri00171 TATG(7) 58 166-190 F :CCATCCATTGCGTAGCTG KY906114
R :CCATTGGTACGTACATCGTG
13 Atri00172 TATG(5) 58 161-177 F :CCAGAGAACGCAAAGAACTG KY906115
R :CTCCTTCAGCATGCTCTTCT
14 Atri00174 TATT(5) 58 185-213 F :GGCCATAATGATCTGGGAG KY906116
R :CGACAGTCGTGAAAAGAGGA
15 Atri00186 TCTT(6) 59 166-186 F :CCACCAAGGGACTAAATCCT KY906117
R :GAACAGAAGCTCTGTAGCGAGA
16 Atri00200 TTCC(5) 59 151-171 F :GGTGGCCTTGCAAATATCTC KY906118
R :AATATGATCGGGGGCAAC
17 Atri00206 TTCT(5) 58 169-173 F :ATTGAGGCCTCTGAGACAGAC KY906119
R :CGCAAGACTACCCAGAAACTAC
18 Atri00223 AAAAG(5) 58 192-208 F :CGATCACTGGCTTAACCTTG KY906120
R :GGCTGCCACATAAATCGTAG
19 Atri00232 AAAGA(5) 58 153-208 F :TAAGTATGCACCAGGTTGCC KY906121
R :ACCCTCTTCTGCATCACTTG
20 Atri00237 AAATT(5) 58 183-203 F :CCAACCTCCTTCTTCTTCCT KY906122
R :GGTTTCGAGGAGAGGGAAT
21 Atri00245 ACCAG(5) 59 190-230 F :CTTTTCTTTGAGTGGCGG KY906123
R :GCCATGAGATAAGATCTCGACC
22 Atri00246 ACTCA(7) 59 190-210 F :GTGAACACGAAGGGAGGTTT KY906124
R :TGCCTAGTGTATGAGGCTTCC
23 Atri00254 AGGTG(7) 58 164-204 F :GGCCCTTGACTAAAGGTATAGG KY906125
R :AGAGGATCAAGGCACATGG
24 Atri00276 CCTCA(5) 60 185-215 F :CCCTCTTCTAATTCCCTCAGGT KY906126
R :CCAAGAAATAACAGCCAGGG
25 Atri00285 CTTGT(5) 57 163-183 F :GGAGTGACTAGGATACCTGTTG KY906127
R :CAGGGACTCTGGGATTATACAG
26 Atri00287 CTTTT(5) 59 176-206 F :GATGGCGCTACAGCTTATCTAC KY906128
R :ACAAAAAGGGACACAGGCAC
27 Atri00326 TGTAC(6) 59 191-211 F :TGGAGGTTGATGATTGCC KY906129
R :GACATAGTGAGCAACAACTGGC
28 Atri00338 TTTGG(6) 57 199-219 F :GCTGCAGCAATGCAGTAT KY906130
R :AGTTAGAGAAGAGCGCCAGTC
29 Atri00456 AAC(8) 59 152-161 F :CTAAGCACTCGCTCAAGTACCTC KY906131
R :GTGAATCCAGAAAGAGTCGG
30 Atri00543 AAT(9) 59 181-193 F :CAGTGCTTCAATAGAGCGTCAC KY906132
R :GACCATGCCAAGGTTGAA
31 Atri00855 ATC(7) 58 182-197 F :GAGATAAGTCTTGATGCCGC KY906133
R :CAATCCACCATTCTCAGCAG
32 Atri00959 CAA(7) 58 176-251 F :ACTATAGAAAGGCCCGGCT KY906134
R :GGCAAGTGATTGTGCAGAC
33 Atri01120 CCA(7) 58 148-175 F :AACTCGTCCTCACTCAAGGTAG KY906135
R :CTTTAGGTTGAGGCTAAGAGGG
34 Atri01347 CTT(8) 59 197-248 F :CCCTAAGAACCTCCCTTCTACA KY906136
R :CTATCGTGACTCAGCCTTTGAC
35 Atri01349 CTT(7) 58 180-195 F :GTCTGGTTACCTCCACCATCT KY906137
R :CCTGGCAGGTATCCTGTACATA
36 Atri01490 GAG(7) 59 180-198 F :GAAACCTGTGAGTTGACGACTG KY906138
R :CATTGAGACGCGTACGAAG
37 Atri01559 GCA(7) 59 188-194 F :CTCATTCATGGAGAGGTCAGTC KY906139
R :TCGAGTTGGACTATTGCCTG
38 Atri01585 GCT(8) 58 180-201 F :GAGTAGCACCTGAAGAGGAAGA KY906140
R :AAGTAGTAGCAGGCAACAGGTG
39 Atri01627 GGC(7) 58 171-186 F :GATTTCCGCTCCCAATTC KY906141
R :ACTCAAACCCACGTTTCG

Table 5

Genetic diversity measures for 39 polymorphic SSR loci using 23 Adenophora triphylla accessions.

No. Marker MAF GN AN HE HO PIC

MAF; Major allele frequency, GN; Genotype number, AN; Number of alleles, HE; Expected heterozygosity, HO; Observed heterozygosity, PIC; Polymorphic information content.
1 Atri00004 0.65 7 6 0.53 0.65 0.50
2 Atri00007 0.65 4 4 0.51 0.65 0.45
3 Atri00011 0.47 9 7 0.69 0.53 0.65
4 Atri00021 0.24 17 9 0.85 0.91 0.84
5 Atri00048 0.59 6 4 0.59 0.41 0.54
6 Atri00051 0.61 5 5 0.57 0.74 0.51
7 Atri00079 0.50 6 4 0.63 0.56 0.57
8 Atri00095 0.33 14 9 0.81 0.87 0.78
9 Atri00108 0.33 15 8 0.79 0.65 0.76
10 Atri00111 0.39 11 9 0.72 0.83 0.67
11 Atri00146 0.28 12 7 0.80 1.00 0.77
12 Atri00171 0.33 11 7 0.79 0.86 0.76
13 Atri00172 0.35 9 5 0.76 0.35 0.72
14 Atri00174 0.48 9 7 0.68 0.45 0.64
15 Atri00186 0.61 6 5 0.57 0.26 0.53
16 Atri00200 0.59 9 6 0.61 0.52 0.58
17 Atri00206 0.87 2 2 0.23 0.26 0.20
18 Atri00223 0.35 10 7 0.76 0.25 0.73
19 Atri00232 0.41 13 10 0.73 0.74 0.70
20 Atri00237 0.52 8 5 0.67 0.74 0.63
21 Atri00245 0.35 14 9 0.75 0.61 0.71
22 Atri00246 0.57 10 5 0.62 0.44 0.58
23 Atri00254 0.35 10 7 0.74 0.65 0.69
24 Atri00276 0.52 12 7 0.69 0.61 0.66
25 Atri00285 0.35 10 5 0.72 0.78 0.67
26 Atri00287 0.64 9 6 0.56 0.36 0.53
27 Atri00326 0.65 9 6 0.54 0.44 0.51
28 Atri00338 0.44 8 5 0.67 0.26 0.61
29 Atri00456 0.52 6 4 0.58 0.57 0.50
30 Atri00543 0.39 8 5 0.71 0.52 0.65
31 Atri00855 0.50 10 7 0.68 0.65 0.65
32 Atri00959 0.17 18 12 0.88 0.74 0.87
33 Atri01120 0.23 18 10 0.85 0.77 0.84
34 Atri01347 0.37 10 8 0.78 0.52 0.75
35 Atri01349 0.39 11 8 0.75 0.52 0.71
36 Atri01490 0.30 12 8 0.80 0.78 0.77
37 Atri01559 0.67 5 3 0.49 0.48 0.43
38 Atri01585 0.48 9 7 0.67 0.24 0.62
39 Atri01627 0.60 8 6 0.60 0.57 0.57
Mean 0.46 9.9 6.6 0.68 0.59 0.64