準備
デモデータの読み込み
library(Biostrings)
filepath <- system.file("extdata", "someORF.fa", package="Biostrings")
x <- readDNAStringSet(filepath)
> x
A DNAStringSet instance of length 7
width seq names
[1] 5573 ACTTGTAAATATATCTTTTATTTTCCG...AACGCTTATCGACCTTATTGTTGATAT YAL001C TFC3 SGDI...
[2] 5825 TTCCAAGGCCGATGAATTCGACTCTTT...CCAGAGTAAATTTTTTTCTATTCTCTT YAL002W VPS8 SGDI...
[3] 2987 CTTCATGTCAGCCTGCACTTCTGGGTC...CCGATGGTACTCATGTAGCTGCCTCAT YAL003W EFB1 SGDI...
[4] 3929 CACTCATATCGGGGGTCTTACTTCCCA...GACGTGTCCCGAAACACGAAAAAGTAC YAL005C SSA1 SGDI...
[5] 2648 AGAGAAAGAGTTTCACTTCTTGATTAT...TAAAATATAATTTATGTGTGAACATAG YAL007C ERP2 SGDI...
[6] 2597 GTGTCCGGGCCTCGCAGGCGTTCTACT...GTTCAAGTTTTGGCAGAATGTACTTTT YAL008W FUN14 SGD...
[7] 2780 CAAGATAATGTCAAAGTTAGTGGTCGT...TAGGGCTAAGGAAGAAAAAAAAATCAC YAL009W SPO7 SGDI...
このオブジェクトxの配列部分だけ欲しいんだけどどうすれば! という話題。
as.characterでいける
7番目の配列はたとえばこうやって取れます!
> as.character(x[[7]])
[1] "CAAGATAATGTCAAAGTTAGTGGTCGTCCTGTGTTTGTAGAATGTGTGTAATATCTTAAAGTTGTCGAACAACCGGGGCTTAAACTTACTAACCCTAACCAAAATTCAGCACCAAGCGACAACGAAGAATTATTGTACAGTGAGGTGTTAAACTTGGAAGGCGTGGTAAGGAAATTGTGTAATACTCTATAACCACATAATAGATCACTGGTGGAAAATATCCACTCCTGTAAATTGCGGTGAGAATCTCTTTGAAAATAGCACGTTAAAACGTTTAAGCTTTCTTTGAAACTACTGACACCCTTAAGCATAAATTGGGTTTGTGGACTTAGTCGTTTTATTATCATTGCTTCTAAATCAGAGCTGGGGTAGTACATTCTACCATAATAAAGGGATTTTTTAACAAATTTCGAGTCATGTAGTAATTTCTTGTCATTGTCGACTGTGGTGTTGTCACTACTCAACGTATTCGCACTACTAACACTGAAATTGAGGTTTGGTTGCAATTGTCTGTATGTTTCGGTGGCATCTTGTAATGGGATATCAGTAGAGTTGCGCATGAATTTCTCCAATTGCTGTGCATCGGAGTATAAATAACTCAGAGAACCATTTATCCTGGACCTCGTAGAAAAATCTAAAGAATTGAATGTATTGGGAGTAGATTTGTTGGAAATTTGCAGGTGTATTGCTGAGGGAATTCGGAAATCTAATAATGTTCTCGATGTGGCCGTTATATCCTCGTAGCTATTTTGCGTACTCCAATGGGTGCTCTGATAAAATGCCCTTAGTACTTGGTCCATATAGGGTAGCATCAAGATCGGTCTTCTCTGTTCGTGTCTTTTTCCTAACGTATATTTGCTTTGTTTCTTCACTCAACAATAAAGTCAAAGTAAAATTAAATACTAATTATTCTTAAAAGGGAAGATGCGAAATTTAGCGAAAATCTATTGATTATACACACAAAGGAAGAAAGGTAGTGGAAAGCTAAATAAAGGAGGTCATGGAGCCAGAGAGCATAGGCGATGTGGGGAACCATGCCCAGGATGATAGTGCCAGTATAGTGTCCGGGCCTCGCAGGCGTTCTACTAGCAAGACATCCAGTGCGAAGAATATACGGAACTCCAGTAATATCTCTCCAGCATCGATGATTTTCAGGAATTTGTTGATACTGGAGGATGATTTAAGACGCCAAGCTCACGAACAAAAGATACTGAAGTGGCAATTCACTTTGTTCTTAGCGTCTATGGCCGGTGTAGGCGCATTTACCTTCTACGAACTTTATTTCACTTCAGATTATGTCAAGGGCCTCCATAGGGTTATTTTGCAATTCACTCTTTCTTTCATTTCCATTACTGTAGTTCTTTTTCATATCAGTGGACAATATAGAAGAACTATCGTCATTCCAAGAAGATTTTTTACCTCTACTAATAAAGGGATTAGGCAGTTTAATGTGAAGCTAGTTAAAGTACAGTCTACGTGGGACGAGAAATACACAGATTCAGTAAGATTTGTGAGTCGAACAATTGCTTATTGTAATATTTATTGTTTGAAAAAATTTCTGTGGCTTAAAGACGATAATGCCATTGTGAAATTTTGGAAAAGTGTCACGATACAATCCCAACCGAGGATCGGAGCTGTGGATGTGAAATTAGTCCTCAACCCCAGAGCATTTAGTGCAGAGATTAGAGAAGGATGGGAGATTTATAGAGACGAGTTTTGGGCCAGGGAAGGTGCTAGAAGACGCAAACAAGCGCACGAACTCCGACCTAAATCAGAATGAAAGAGTTGGAGGGCTTCTTCCTTCGAATAAGAGGTCATATTTACCTATGTAAAATTGTAACCATCTATGTTCACACATAAATTATATTTTATACATTATTAGAAGTGAAGCTGTTGTGTCGTGAAAATTTTACAAATCCGTCATTTCATATTTAAGTTTTCCAACAAGTGCTAGAAAACCTAGGGGTTGTTGAAATTGGTTAAACAAGGCATCTTATTATACATACAACAGCATAACGCTAGAGGGGCAAGAAGGAAGAACTTAAAATAATAGGTGTAAAATGACTTTGGCTTTTAATATGCAACGGTTGGTGTTTCGTAATTTGAATGTTGGGAAGCGCATGTTCAAGAACGTCCCCTTATGGAGGTTTAATGTCGCCAATAAATTAGGAAAGCCCTTAACTCGCTCTGTAGGGTTAGGCGGTGCTGGCATAGTTGCTGGTGGCTTTTACTTGATGAATCGCCAGCCTTCTAAGTTGATATTCAATGATTCTTTAGGGGCAGCTGTCAAACAACAGGGTCCCTTGGAACCAACTGTGGGCAACAGTACGGCAATTACCGAGGAAAGGAGGAACAAAATAAGTAGTCACAAGCAGATGTTTTTGGGATCATTATTCGGTGTTGTTTTAGGAGTTACGGTGGCTAAGATATCAATTTTGTTTATGTATGTCGGTATTACAAGCATGCTTCTTTGTGAATGGTTACGGTACAAGGGATGGATTCGCATTAATTTGAAAAATATCAAATCTGTAATTGTTTTGAAAGATGTAGACTTGAAGAAACTGCTTATTGATGGGTTATTGGGTACAGAATACATGGGTTTTAAAGTATTCTTTACATTGAGTTTCGTATTAGCAAGTTTAAATGCTAACAAATGAGCAAGACAAATGACCAGATATAAACGAGGGTTATATTCTTTCGTTTTATACTTTTTTATTTTTGGTATTTCATTTATCCTATACAGTAAATATACATAGGGCTAAGGAAGAAAAAAAAATCAC"
文字列長はnchar()で確認できます
> nchar(as.character(x[[7]]))
[1] 2780